本文是一篇计算机论文,为了降低嵌入水印对数据库的影响,本文提出一种基于数据压缩的水印预处理算法,用QR码作为水印载体,利用Haar小波变换进行数据压缩并且通过SVD分解提取QR码的特征值,经过数据压缩算法处理得到水印序列,增大了相同水印序列长度下水印包含的信息量。
第一章 绪论
1.1 研究背景与意义
伴随着5G时代的到来,数据的存储和计算技术的发展势如破竹,给生活带来便利的同时也潜藏着巨大的危害,用数据记录信息、用云端存储数据,这种量化的生活方式虽然减轻实体负担、降低生活成本,但也让人们对它有了依赖。无论是绑定身份信息、实时获取位置还是扫码收付款都在悄无声息的将用户的个人信息公之于众。信息传播之快、途径之广使得授权变得困难进而引发版权纠纷。如今我们越来越重视正版的使用和知识产权的归属,如何保护信息不被未授权传播和恶意破坏是目前信息版权保护重点研究的问题。
如今信息安全问题渗透到各个行业,不仅是互联网,银行、能源、医疗、制造业等都无一幸免。PSafe的网络安全实验室dfndr宣称巴西某个数据库遭遇了史无前例的泄密,可能泄露了包括当地人的姓名、出生日期、CPF号码、企业内部数据等在内的隐私信息,无数企业和居民受到波及;特斯拉被曝光通过车内摄像头来监控车主,有窃取用户隐私的嫌疑,中国农业银行也因安全系统有漏洞发生数据泄露并处以420万元的罚款;美国当地最大的燃油管道运营商Colonial Pipeline遭到了黑客的攻击,其能源供应网络受到了严重的破坏,燃油燃气等能源供应形势如履薄冰;滴滴违反法律法规收集用户个人信息,被强制下架等等。短时间内发生不计其数的数据泄露事件昭示着数据安全的重要性。为了防止信息泄露,保护数据安全,追溯泄密源头是目前炙手可热的研究内容。
计算机论文怎么写
.........................
1.2 国内外研究现状
1.2.1 数字水印
数字水印技术[2]通过在媒体数据中嵌入特殊信息的方式保护数字版权,一直是国内外研究的热点。它可以高效的解决信息安全问题,应用前景广阔。一般来说数字水印应用于诸如文本[3]、图像[4][5]、音视频[6][7]等多媒体领域,不仅保护了版权还验证了数据的完整性。
早在1992年国际上就有对数字水印技术的研究发表。随着信息隐藏研究的快速发展,1999年Stefan Katzenbeisser和Fabien Petitcolas等人[8]出版了第一本信息隐藏领域的专业论著,公开阐述了数字水印技术。数字水印技术涉猎的学术领域十分广泛,如密码学、数字通讯、信号处理和模式识别等,学者的研究角度也十分独特。1993年,Tirkel[9]提出了一种典型的利用空间域隐藏数据的算法即最低有效位算法LSB(Least Significant Bit)。因为其算法简单、应用广泛的特点,许多研究者对LSB算法加以扩展应用。Schyndel和Tirkel等人[10]于1994年提出的LSB算法将扩展m序列作为水印,提供了更快速和高效的解码。1997年,Wolfgang和Delp[11]提出了一个二维重塑的m序列,并对水印的检测进行了改进。同年,Fleet[12]把LSB算法应用在彩色图像上。但是基于空间域设计的数字水印算法原理简单导致其抵御攻击的能力较差,于是1996年Cox[13]等人主张将水印构建为一个独立且相同分布的高斯随机矢量,以类似扩频的方式插入数据最重要的频谱成分中,使水印对信号处理操作和常见的几何变换具有鲁棒性。扩频技术的优秀特性备受学术界的瞩目,随后衍生出小波变换域,将水印信息嵌入到载体图像变换后的低频子带中,降低了信号的系数使得水印信号不易被察觉,提高了水印的安全性和鲁棒性。数字水印技术的发展更上一层楼,基于小波变换域的水印算法也因此成为热门的数字水印研究之一。刘九芬等人[14]基于嵌入对策对水印算法中小波基的选择及性质进行了研究,研究表明正交小波基低频带所聚集的能量对水印鲁棒性的影响微乎其微,同时指出Haar小波的具有优良的稳健性,设计复杂度低,更适用于数字水印。Makbo等人[15]在2016年结合奇异值分解SVD(Singular Value Decomposition)和人类视觉系统的离散小波变换DWT(Discrete Wavelet Transform)域提出了强鲁棒的分块图像水印方案,分别对划分了区域的子图像嵌入水印,算法能够有效的抵御图像处理攻击和几何攻击且具有良好的隐蔽性。2018年,Liu Y[16]等设计了一种基于DWT和SVD的半盲水印算法,引入了RSA非对称加密算法,加密后的水印安全性更强。
......................
第二章 相关背景知识介绍
2.1 数据库水印技术
数据库水印技术由数字水印技术演化而来,不同于传统的数字水印,数据库水印的嵌入载体是数据库。由于数据库对数据修改极其敏感且容错率低,对数据库水印的嵌入要求相对较高,嵌入的水印尽可能不改动或是最小改动原始数值,否则会影响数据库的使用,除此之外,提取水印时要保证数据库可以还原出原始数据,提取正确完整的水印序列以此来确保数据库的归属版权。
随着数据库水印技术的不断发展,除了对技术本身的研究,其应用性和实用性不免会和多媒体数字水印进行比较。由于载体的差异,数据库水印研究的重点和难点与多媒体数字水印相比也有很大的区别,以下介绍数据库水印和多媒体数字水印的不同点:
(1)数据库作为底层的数据存储工具,在实际应用过程需要经常维护更新,例如对元组进行增加、删除、修改、查询等操作。数据库相较于静态的多媒体数据,数据被修改的概率更大。
(2)多媒体数据的容错率高,更容易接纳外界信息,对于嵌入水印信息的操作,修改少量比特位,通过肉眼观察很难察觉出异常。而对于数据库来说,数据是完全量化透明的,嵌入水印直接可以看出数据的改变,需要着重考虑数据库嵌入水印后的可用性问题。
(3)数据库的冗余量小。诸如图像、音视频等包含许多比特位的多媒体数据,结构相对宽泛且离散,存在较多冗余。而数据库存储的大部分数据都有特殊的含义,无法随意改动,冗余较低。
(4)多媒体数据对象存在数据空间排序问题,改变数据的位置会影响多媒体载体且易被用户察觉。而关系数据库由元组构成,并不在意元组的储存顺序,可以随意改变元组位置,不易被用户察觉。
............................
2.2 数据库水印分类
按照对数据的修改程度,数据库水印技术可以分为有失真数据库水印和无失真数据库水印[38]。前者是将水印嵌入到数据库中,会破环数据库的数据,后者是提取数据库的特征作为水印,不会改变数据库的数据。
2.2.1 无失真的数据库水印技术
无失真顾名思义不会造成数据的失真,因此基于无失真的数据库水印方案大多是通过载体的自身数据来构造水印信息,不拘泥于特定的数据类型,无论是数值型还是非数值型都可以应用,应用场景广泛。现有的方法主要包括基于元组哈希值、基于属性标记、基于二进制字符串、基于R树、基于零水印等水印方案,本节主要介绍零水印这种无失真的数据库水印。
零水印技术最早用于图像载体,它不向载体嵌入任何水印信息,取而代之的是通过提取载体自身的特征来构造水印,因此不会造成数据的失真。当发生数据泄密时,通过再次构造零水印与原始的零水印进行匹配来追溯泄密的源头,文献[41-43]对零水印进行了相关研究。零水印的构造和检测模型如图2.1所示。
计算机论文怎么写
.......................
第三章 基于多面体抽象域的强鲁棒无失真数据库水印方法 ........................... 21
3.1 相关定义和总体框架 .................................. 21
3.1.1 相关定义 ......................................... 21
3.1.2 总体框架 .................................... 22
第四章 基于动态差分扩展的强鲁棒有失真数据库水印方法 ................. 35
4.1 总体框架 ................................. 35
4.2 数据库水印预处理 ............................ 36
第五章 实验与结果分析 ............................ 51
5.1 无失真数据库水印方法的检测实验与分析 ....................... 51
5.1.1 相关参数分析 ............................... 51
5.1.2 鲁棒性分析 ................................ 53
第五章 实验与结果分析
5.1 无失真数据库水印方法的检测实验与分析
基于多面体抽象域的强鲁棒无失真数据库水印方法PADW的实验设计主要针对以下几个研究问题:
(1)水印生成参数γ和水印检测参数τ对水印方法的影响;
(2)水印方案是否对典型的攻击具有鲁棒性,并且在实践中是否有效。
本章仿真实验的数据来源于UCI机器学习资源库网站http://archive.ics.uci.edu/提供的Productivity Prediction of Garment Employees Data Set,该数据集包含1197个元组和15个属性。本实验在2.10 GHz的处理器和12GB内存的计算机上进行,实验环境为jdk1.8、python3.7和mysql8.0数据库。
5.1.1 相关参数分析
由于无失真的数据库水印方法会生成和数据库同等大小的水印表,随着数据规模的增大,算法耗时会越来越长,运行效率下降。本节统计了不同数据规模下算法的耗时情况,如图5.1所示。由图可知,当元组数为10000时算法的耗时出现拐点,整体耗时在10s左右,属于可以接受的范围;当元组数超过10000时算法耗时急剧增长,且速率呈上升趋势;当数据规模达到20000时,时间接近5分钟,算法成本已经超过带来的收益,效果大打折扣。该实验充分说明了基于多面体抽象域的强鲁棒无失真数据库水印方法PADW不适用于元组数超过10000的大规模数据库,因此接下来的实验将元组数控制在10000以内,以确保算法的可用性。
计算机论文参考
....................................
第六章 总结与展望
6.1 工作总结
数字化时代给我们带来便利的同时也潜藏着众多隐患,信息泄露造成的数据安全问题愈发严重,个人信息和隐私数据无法得到保护。数据库作为最常用的数据存储工具,面临的信息安全问题危如累卵。因此,根据数据库数据是否改变,针对有失真和无失真的数据库水印的不同特性,提高其鲁棒性是本文的主要研究内容。
本文分别对有失真和无失真的数据库水印的鲁棒性进行了研究,分别提出了基于多面体抽象域的强鲁棒无失真数据库水印方法和基于动态差分扩展的强鲁棒有失真数据库水印方法,通过对其进行实验分析阐明方法的可行性和优势。本文所做的工作主要如下:
(1)提出一种基于多面体抽象域的强鲁棒无失真数据库水印方法。利用多面体抽象域分析程序语句生成数值不变式,用其表示数据库的稳定单元,考虑到数据库间也存在着约束因此在稳定单元中引入数据库间的约束属性。算法思虑到不同场景下用户对各个属性的敏感程度有差异,于是采用熵权法对敏感属性进行客观赋权,利用计算了属性权值的多维桶技术完成数据库分组。实验结果表明本文提出的算法扩大了水印抵御攻击的范围,在提高了数据质量的同时保护了敏感属性的安全性。使数据库据水印具有更好的鲁棒性、安全性和更广泛的应用场景。
(2)为了降低嵌入水印对数据库的影响,提出一种基于数据压缩的水印预处理算法,用QR码作为水印载体,利用Haar小波变换进行数据压缩并且通过SVD分解提取QR码的特征值,经过数据压缩算法处理得到水印序列,增大了相同水印序列长度下水印包含的信息量。实验结果表明数据库水印预处理降低了嵌入水印的长度,达到了减少数据失真的目的。同时还过滤了多种信号攻击,提高图像抵御攻击的能力。
参考文献(略)