首页 理论教育数字水印技术原理-书名《计算机网络与信息安全》

数字水印技术原理-书名《计算机网络与信息安全》

【摘要】:纠错编码水印的预处理方法由于可以把数字产品定义为信道,数字水印定义为信道中传输的信号,各种对水印的攻击定义为信道中的噪声,故水印信号的生成可以基于扩频原理。同时,为了提高嵌入的数字水印信息的鲁棒性,也可以采用通信中的纠错编码技术,对数字产品版权信息进行纠错编码生成数字水印信息,以提高数字水印在信道中传输的可靠性,即抗干扰(抗攻击)能力。

数字水印通过一定的算法将一些标志性信息直接嵌到多媒体内容中,但不影响原内容的价值和使用,并且不能被人的感觉系统觉察或注意到,只有通过专用的检测器或阅读器才能提取。与加密技术不同,数字水印技术并不能阻止盗版活动的发生,但它可以判别对象是否受到保护,监视被保护数据的传播、真伪鉴别和非法复制、解决版权纠纷并为法庭提供证据。

所有的数字水印技术都包含两个基本方面,即水印嵌入系统和水印恢复系统,后者也称水印提取或水印解码系统。嵌入器至少有两个输入量:一个是原始信息,它通过适当变换后作为待嵌入的水印信号;另一个就是要在其中嵌入水印的载体作品。水印嵌入器的输出结果为含水印的载体作品,通常用于传输和转录。在设计、使用一个具体的水印算法时,可根据具体的情况综合考虑,比如数字作品的使用限制、应用目的以及其他约束条件等。

(一)数字水印的生成

数字水印生成是数字水印处理过程的第一步关键步骤,构成水印的序列通常应该具备不可预测的随机性。由于人类视觉系统对纹理具有极高的敏感性,故水印不应含有纹理,水印应该具有与噪声相同的特性。因此,目前文献中一般采用高斯白噪声、伪随机序列、根据有特定含义的原始水印所生成的随机序列、实数序列、复数序列等随机序列作为水印嵌入到载体作品中;有时还会考虑采用特殊形状的水印,如六边形水印、圆形或环形水印和自相似水印。通常意义上说,数字水印生成过程就是在密钥K的控制下由原始版权信息、认证信息、保密信息或其他有关信息m生成适合于嵌入到原始载体X中的待嵌入水印信号W的过程。

1.水印预处理的方法

下面介绍几种常见的水印预处理的方法。

(1)伪随机水印的预处理

伪随机水印实际上是一个伪随机序列,通常可以作为其他水印生成算法的初始水印,例如在扩频水印生成算法中通常要用宽带伪随机序列进行扩频。常见的伪随机水印有以下几种处理方法:①在无原始信息参与的情况下,直接产生伪随机序列作为待嵌入的水印;②先产生伪随机序列,然后与原始信息进行异或相乘;③对原始信息(或水印信号)进行伪随机排序后作为待嵌入水印,目的是提高水印的安全性和鲁棒性。

(2)扩频水印的预处理

扩频技术是一种信息处理技术,它利用与待传输数据(信息)无关的扩频码对待传输的信号进行频谱扩展,使之远远超过待传输信息所必需的带宽,在接收机中采用相同的扩频码解扩和恢复数据。

(3)混沌水印的预处理方法

混沌序列具有安全性、对初值的极端敏感性等优点,同时具有低通特性,可以用来抵抗低通滤波或JPEG压缩攻击。目前,用于水印生成的混沌映射主要有Logistic映射、Chebshev映射、Reny映射等。

(4)纠错编码水印的预处理方法

由于可以把数字产品定义为信道,数字水印定义为信道中传输的信号,各种对水印的攻击定义为信道中的噪声,故水印信号的生成可以基于扩频原理。同时,为了提高嵌入的数字水印信息的鲁棒性,也可以采用通信中的纠错编码技术,对数字产品版权信息进行纠错编码生成数字水印信息,以提高数字水印在信道中传输的可靠性,即抗干扰(抗攻击)能力。基于纠错编码的数字水印生成方法常用的纠错编码技术有汉明码、BCH码、RS码和卷积码等。

2.视频水印生成

(1)视频水印生成模型

水印生成是视频水印处理过程的关键步骤之一,通常要求水印序列具有不可预测的随机性。

图6-2 视频水印生成的一般模型

据图6-2所示,视频水印生成过程主要包括:

①采用伪随机序列发生器(产生m序列或Gold序列)或混沌系统(产生高斯噪声序列)生成一维二值水印序列。

②为了增强视频水印系统的安全性,由密钥k控制的伪随机序列对水印进行置乱,即使攻击者知晓水印嵌入的位置,由于没有密钥也无法破译水印信息。

③将一维水印信号变换为二维水印图案,即待嵌入的视频水印。

(2)扩频技术

为了提高视频水印的稳健性和安全性,可采用扩频技术和纠错编码技术。

扩频作为一种新的通信方式,具有抗干扰能力强、低截获概率、低功率谱密度、高保密性等优点。扩频系统中使用的伪随机序列具有类似白噪声的特性;具有尖锐的相关函数,易于信号分离;优良的抗干扰特性。

基于扩频原理的水印生成可以把数字视频作品理解为“信道”,视频水印可理解为“信道”中传输的信号,对水印的各种攻击可理解为“信道”中的“噪声干扰”。基于扩频原理的视频水印具有很高的稳健性和安全性。

(3)纠错编码技术

为了使视频水印具有很好的稳健性,在水印生成过程中可以采用纠错编码技术,通过对数字产品版权信息进行纠错编码生成数字视频水印信息,以提高视频水印在信道中的传输可靠性,即抗干扰能力。

(二)数字水印的嵌入

根据所基于的域不同,数字水印嵌入技术主要分为时/空域算法、变换域算法和压缩域算法三大类。时/空域算法将水印信息直接嵌入到音频时域采样、图像空间像素和视频数据等原始载体数据中,即在媒体信号的时间域或空间域上实现水印嵌入。变换域算法将水印信息嵌入到音频、图像、视频、三维目标等原始载体的变换域系数中。广义的压缩域算法是指充分考虑JPEG、MPEG和VQ技术的结构和特性,将水印嵌入到压缩过程的各种变量值域中,以提高对相对压缩技术或压缩标准攻击的鲁棒性为目标的嵌入算法。狭义的压缩算法是指水印嵌入到JPEG位流、MPEG位流和VQ索引流中。

目前,鲁棒性水印的加载方法的研究趋势是在变换域中添加水印,并占据了主要地位,这是因为通过这几年对数字水印的研究,人们发现与空间域方法相比,变换域的方法具有如下优点:

(1)在变换域中嵌入的水印信号能量可以散布到空间域的所有像素上,有利于保证水印的不可见性。

(2)在变换域中人类视觉系统的某些特性(如频率掩蔽效应)可以更方便地结合到水印编码过程中。

(3)变换域的方法可与国际数据压缩标准兼容,从而实现在压缩域内的水印算法,同时,也对有损压缩和其他的信号处理具有较强的免疫力。

虽然时/空域水印算法在鲁棒性等方面不及变换域水印算法,但是时/空域水印算法具有对攻击的时间和空间位置的定位能力,因而在现实生活中仍有较多的应用。下面我们介绍两种时/空域水印算法。

(1)加性和乘性嵌入规则

一种最常见的嵌入规则是加性规则,通常,在加性规则中都带有嵌入因子,以调整所嵌入水印的不可见性和鲁棒性。在时/空域内,嵌入公式为

其中,为含水印载体,x={xi0≤i≤N}和ω={ωi0≤i≤N}分别为原始载体和水印,α为嵌入因子。

如果在水印生成时,已经较好地考虑到水印的不可见性和鲁棒性,则只需要将生成的水印信号与原始载体直接相叠加而不需要乘上嵌入因子,嵌入公式为

其中,为含水印载体,x={xi0≤i≤N}和ω={ωi0≤i≤N}分别为原始载体和水印。

时空嵌入技术中,乘性规则有两种形式,一种是将原始载体数据直接乘水印,表示为

另一种形式是在上式的基础上乘上嵌入因子再加上原始载体数据,表示为

其中,为含水印载体,x={xi0≤i≤N}和ω={ωi0≤i≤N}分别为原始载体和水印,α为嵌入因子。

(2)LSB数字水印算法

最低有效位也称为最不显著位,它是载体信息用二进制表示时的最低位。下面以灰度图像为载体,介绍LSB数字水印算法。

如果用8比特的二进制来表示灰度图像的每一个像素值,所有像素的最低位构成的位平面显现随机特性,而且改变最低位不会对视觉效果产生明显影响,因此可以考虑用水印信息直接代替数字图像的最低位,其嵌入过程主要分为以下3步:

①将原始图像的空域像素值由十进制转换到二进制表示,以3×3大小的块图像为例,如图6-3所示。(www.chuimin.cn)

图6-3 原始载体图像的像素值用8比特的二进制表示

②用二进制水印信息中的每一比特信息替换与之相对应载体数据的最低有效位,假设待嵌入的二进制水印信息序列为{010001001},则替换过程如图6-4所示。

图6-4 用二值水印信息替换载体数据的最低有效位

该替换过程也可以用嵌入公式来描述:

式中:Xi,j为第i行j列的原始图像像素值:Wi,j为对应的待嵌入的二值水印。

上面所说的嵌入公式表示的是对载体图像像素的最低有效位清零后,再直接加上二值水印。

③将得到的含水印的二进制数据转换为十进制像素值,从而获得含水印的图像,如图6-5所示。

图6-5 将替换之后的二进制数据转换为十进制像素值

水印信息的提取只需要将对应像素值转换为二进制形式,然后提取最低有效位即可,该方法属于盲检测的算法。

(三)数字水印的检测和提取

数字水印的检测算法和提取算法是数字水印系统的关键部分之一。所谓水印检测,是指根据检测密钥通过一定的算法可以判断作品中是否含水印。所谓水印提取,是指根据提取密钥通过一定的算法(往往是嵌入算法的逆过程)提取出可疑作品中的每个印记,其长度等于原始水印序列的长度。如果水印检测或提取过程中需要用到原始载体,则此过程为明检测或明提取,如果水印检测或提取过程中不需要原始载体,则称此过程为盲检测或盲提取。一方面,水印提取过程往往与水印嵌入算法密切相关;另一方面,水印提取之前往往先进行水印检测。所以,水印检测和提取是密切相关的。一个水印检测算法是否有效,取决于人们所选取的检测算法的模型与实际是否接近,检测算法的模型包括一系列的假没,主要有以下三个方面:①对待检测信号的统计特性的假设,在水印系统中对应于水印信号的统计特性;②噪声的统计特性的假设,在水印系统中对应于载体信号和攻击引入的噪声的统计特性;③噪声与信号的叠加方式,即水印的嵌入方式。

下面以量化索引调制水印方案为例,介绍数字水印的检测和提取。

量化索引调制中,将嵌入函数记为s(X;m),并称为由m索引的关于X的函数。其中m是与水印相对应的索引,一个索引又与一个量化器相对应。例如,对于二值水印而言,0和1对应两个索引值1和2,这两个索引又与量化器1和2相对应。量化索引调制的嵌入函数可以表示为

式中:Δ为量化器的量化步长;q(X;m,Δ)表示量化步长为Δ的第m个量化器函数。量化器可以采用均匀量化、非均匀量化、矢量量化和标量量化等。

图6-6 QIM水印信息嵌入技术示例

量化索引调制首先用待嵌入的水印信息来调制一个或者一系列索引,然后用相应的量化器或者量化器序列来量化载体信号。图6-6显示的是QIM水印嵌入技术示例。这个例子中,嵌入的水印信息是二进制0和1,对应索引值m∈{1,2}。这里需要两个量化器,对载体数据X进行量化,得到两组不同的数据,图6-6中分别用“○”和“※”来表示(也可称为量化后的数据)。例如,如果m=1,则选择“※”量化器对载体数据X进行量化,并选择离X最近的“※”点作为量化后的数据(为了确保较好的不可感知性)。如果m=2,则选择“○”量化器对载体数据X进行量化,并选择离X最近的“○”点作为量化后的数据。

水印提取时,由于“○”和“※”分别对应不同的量化器1和2,根据不同的量化器索引便可提取水印信息0和1。

下面给出一种常用的量化方法。

为了实现盲提取,一个实用的方法是在嵌入秘密水印信息时采用量化索引调制(QIM)方法,其中比较著名的是抖动调制(Dither Modulation)方法,其主要思想是根据秘密水印信息的二进制位来调制量化区间。对于变换域来说,抖动调制的对象是变换域系数的幅度或者相位,也可以说是实部或者虚部。

假设待量化的系数为g,待嵌入的秘密水印信息的二进制为w(0或1),量化步长为Δ,量化处理后含有秘密比特信息的系数为g′。在嵌入秘密水印信息的二进制w时,要根据待基于量化系数g的取值范围选取不同的量化方法。

单极性抖动调制是指待量化的系数的取值只能是正数或负数(如离散傅里叶变换系数的幅度)。当g≥0、g<0时采用量化单极性系数g嵌入保密二进制信息w的原理分别如图6-7、图6-8所示。

图6-7 g≥0时量化单极性系数嵌入秘密水印信息的原理

图6-8 g<0时量化单极性系数嵌入秘密水印信息的原理

单极性系数的量化过程及其表达式如下。

(1)划分区间集

选取合适的量化步长Δ,将坐标轴分割成如图6-8所示的A区间集和B区间集。

(2)确定区间集内坐标值的双重含义

如果用于计算,区间集内的坐标值具有表示数量大小的实际意义;如果用于表示秘密水印信息的比特信息,则不管该坐标的数值大小,凡属于A区间集的坐标都代表二进制数“1”,属于B区间集的坐标都代表二进制数“0”。

(3)取整数商和余数运算

选取量化步长Δ对需要量化的系数g进行取整数商和余数运算。假设所求得的整数商为n,余数为γ,则有:

(4)量化系数

系数g的量化结果与秘密信息w密切相关:当w=1时,使量化结果g′等于与g最接近的A区间集中某一区间的中间坐标值;当w=0时,使g′等于与g最接近的B区间集中某一区间的中间坐标值。当g≥0时,系数g的量化结果如下(假设k=0,1,2,…):

当n=0,w=1时

当n=0,w=0时

当n≠0,w=1时

当n≠0,w=0时

对单极性系数g进行量化后,比特信息w包含的信息有量化处理结果g′所在区间集唯一确定:如果g′处在A区间集内,则g′代表的比特信息是“1”;反之,如果g′处在B区间集内,则g′代表的比特信息是“0”。

从上文的分析可以看出,当n=0时,即量化操作引起的最大误差是量化步长Δ的1.5倍;当n≠2时,即量化操作引起的最大误差是量化步长Δ。