首页 理论教育隐写分析技术概述及算法介绍

隐写分析技术概述及算法介绍

【摘要】:图6-9信息隐藏的一个通用模型(三)隐写分析系统的分类隐写技术是一种新兴的知识领域,尽管还处在发展阶段,但是已经具有了自己的意义和内涵。目前主要采用的是盲隐写技术。对于非统计性隐写分析而言,通过人类感知系统、文件结构标志异常或载体特殊部分异常等手段来判断载体是否含有隐秘信息,都可以认为是非统计性隐写分析。(四)隐写分析技术算法下面以专用隐写分析和通用隐写分析为例,介绍隐写分析技术的算法。

隐写术(steganography)是将秘密信息嵌入伪装载体的一门科学,其主要目标是使嵌入的秘密信息不可检测。但在这个世界上,事物总是两两对立,相互作用,就像矛与盾的关系一样,是对立统一的。既然存在着隐写术,就会存在敌手对其进行隐写分析(steganalysis),隐写分析者判断载体中是否存在隐藏的信息,如存在,则会想方设法地进行破译与提取。当某些隐写算法被破解后,就会有新的隐写算法问世,之后又会进行新一轮的破译,这个过程循环往复,像大海的波浪一样,推动着信息隐藏领域的研究不断发展前进。

(一)隐写分析定义

隐写分析技术是对表面正常的图像、音频、视频等媒体信号(尤其是通过互联网进行传输的信号)进行检测,判断其中是否嵌有秘密信息(这些秘密信息是通过一定的隐写算法嵌入的),甚至只是指出媒体中存在秘密信息的可能性,这样就可以找到敌对隐蔽通信的信源,从而阻断隐蔽通信的信道。

由于隐写者必须通过修改原始数据才能实现秘密信息的嵌入,因此载体数据的统计特性不可避免地会发生一些变化。虽然分析者并不知道原始载体,但可以利用载体数据的统计特性的异常来觉察到秘密信息的存在。即使不能破解秘密信息的具体内容,分析者仍可以阻断隐蔽通信并追查秘密信息的收发双方。

(二)隐写分析系统的模型

图6-9是信息隐藏的一个通用模型。Alice和Bob欲利用隐信息的隐写技术进行隐匿通信,待隐藏的信息为隐信息(Hidden message),它可以是版权信息或秘密数据,也可以是一个序列号等。显信息为载体信息(covermessage),如数字图像、音频和视频片段等。信息隐藏过程一般由密钥(Key)来控制,通过隐藏算法(Embedding Algorithm)将秘密信息隐藏于公开信息中。隐蔽载体(隐藏了秘密信息的公开信息)通过信道(Public Communication Channel)传递,提取(Extraction)从安全通道得来的密钥,再从隐蔽载体中恢复/检测秘密信息。由于是在公共信道上通信,因此可能会有第三方Eve进行窃听和侦测载体中是否有隐信息存在。Alice可以通过开关选择是否进行隐写操作,以迷惑第三方Eve。现代信息隐写技术一般都会利用人的视觉系统(VIS)或听觉系统(HIS)对数字信号敏感性的不匀称性或不完善性,使得载体在隐写操作后的显信息不发生明显的变化。

图6-9 信息隐藏的一个通用模型

(三)隐写分析系统的分类

隐写技术是一种新兴的知识领域,尽管还处在发展阶段,但是已经具有了自己的意义和内涵。按照不同的分类标准,隐写技术的类型大致如下:(1)按密钥分类,若嵌入和提取采用相同密钥,则称其为对称隐写算法,否则称为公钥隐写算法。(2)按载体类型分类,这是基于文本、图像、视频和声音等数字媒体的隐写技术。(3)按提取要求分类,若在提取隐藏信息时不需要利用原始载体,则称为盲隐写,否则称为非盲隐写。显然使用原始的载体数据更便于检测和提取信息,但是,在数据监控和跟踪等场合,我们并不能获得原始的载体。对于其他的一些应用,如视频水印,即使可获得原始载体,但由于数据量大,要使用原始载体也是不现实的。目前主要采用的是盲隐写技术。(4)按目的分类,主要可分为隐写术和水印技术。隐写术主要用于隐匿通信,它所要保护的是隐信息;水印技术主要用于版权保护及真伪鉴别等目的,它最终所要保护的是载体本身。另外,从隐写分析过程中,依据所提取特征的所在域的不同,还可以将隐写分析算法划分为空域隐写分析和变换域隐写分析等。空域隐写分析的主要研究对象是空域隐写算法,如空域LSB隐写、EzStego、S-Tools、Steghide和BPCS等,这在隐写分析研究早期是非常活跃的领域。变换域隐写分析主要针对DCT域、小波域等隐写算法,如JSteg、F5、OutGuess和MB等,是近年研究活跃的领域。

在实际操作使用过程中,数字隐写分析系统习惯上被分为非统计性隐写分析和统计性隐写分析。对于非统计性隐写分析而言,通过人类感知系统、文件结构标志异常或载体特殊部分异常等手段来判断载体是否含有隐秘信息,都可以认为是非统计性隐写分析。这一类分析方法通常只适用于特殊的隐写方法,如针对文件结构的隐写等,可应用的范围相对较窄,缺乏普适性。

(四)隐写分析技术算法

下面以专用隐写分析和通用隐写分析为例,介绍隐写分析技术的算法。

1.专用隐写分析算法

(1)卡方分析

LSB简单替换隐写的主要安全漏洞在于像素值只在2k和2k+1之间转换[2],这导致隐写后的直方图中,h2k和h2k+1的值总是趋近于相等,而且二者的和不会发生改变,记

大量的统计实验表明

上式中:N(0,1)为标准正态分布。(www.chuimin.cn)

结合n个独立正态分布的平方和服从卡方分布,可以进一步得到:

上式中:n为h2k和h2k+1可组成数字对的数量,h2k+h2k+1为0的情况不计入在内。r越小,表示图像中含有秘密信息的可能性越大。结合卡方分布的密度函数可计算载体被隐写的可能性:

如果p接近于1,则说明载体图像中含有秘密信息。需要指出的是,如果秘密信息没有嵌满所有像素,并且嵌入位置会随机地分布于整个图像,加之分析者很难知道秘密信息的准确位置,在整幅载体图像中应用卡方检测就难以奏效。

(2)RS分析

Fridrich于2001年提出的RS(regular groups and singular groups)隐写分析方法把图像像素分成规则类、异常类和不可使用类,根据待测图像LSB置换操作前后各类像素组的变化曲线能够可靠地检测灰度和真彩色图像并估计秘密消息的嵌入量,但RS的检测结果直接受载体图像噪声、随机性和秘密信息嵌入位置的影响。

假设给定灰度图像的分辨率为N×M,其中,像素灰度值的范围是[0,255],将图像分组,对于每组采用非负翻转,即M中元素的值非负,考察图像的变化情况。用R1表示FM翻转后正则图像组在所有图像组中的比率;S1记为FM作用后奇异图像组在所有图像组中的比率,易知R1+S1≤1。同理,应用非正翻转考察图像的变化情况,用R-1表示F-1翻转后正则图像组在所有图像组中的比率;S-1记为F-1,作用后奇异图像组在所有图像组中的比率。

依据大量的统计实验,Fridrich认为:R1和S1与信息嵌入率p成二次曲线关系,R-1和S-1则与之呈线性关系,图6-10所示是RS曲线与信息嵌入率之间的关系示意图

图6-10 RS曲线与信息嵌入率之间的关系示意图

Fridrich在此基础上总结出R1,S1,R-1以及S-1在p/2和1-p/2处的值求解方程:

计算方程中最小的根z,并进一步计算得到嵌入率p=z/(z-0.5)。

Dumitrescu于2003年提出的样本对分析法达到了与RS最优检测等效的结果。该分析法根据相邻像素值的奇偶性质将像素对分为4种基本集合,秘密消息的嵌入导致像素对从一个集合转换到另一个集合,根据集合更改的比例采用二次方程建模来估计嵌入量。该方法适用于对连续信号采样的检测,但检测结果直接受秘密信息嵌入位置影响,对非随机嵌入无效。

在专用隐写分析领域还有很多其他的检测算法,如DIH分析、JPEG兼容性分析、JPEG图像二次压缩检测、扩展的WS分析算法等。

2.通用隐写分析算法

通用隐写分析并不针对某一特定的隐写方法,而是针对未知隐写所产生的含密信号进行检测,更具有使用性。

针对通用隐写分析国内外学者都有不同程度的探索。2003年Avcibas提出IQMs(image quality metrics)方法,2004年Farid采用Fisher线性判别式、线性与非线性支持矢量机来判别和归类的方法,国内学者提出一种基于直方图频域统计矩的图像通用隐写分析技术,但以上方法都需要对分类器进行训练。