信息隐藏是利用人类感觉器官对数字信号的感觉冗余和图像、语音等信源的数字冗余特性,将秘密消息隐藏在载体中进行传递,使观察者和监视系统无法觉察到信息的存在,以实现隐蔽通信等功能的技术。载体可以是文本、图像、语音、视频、IP数据报等。
隐写分析(steganalysis)是指在已知或未知嵌入算法的情况下,从观察到的数据检测判断其中是否存在秘密信息,分析数据量的大小和数据嵌入的位置,并最终破解嵌入内容的过程。
第一步是构建Stego。本文首先介绍了JPEG图像隐写术的发展状况,概略的介绍了JPEG图像的结构以及隐写检测思路。然后深入分析nsF5和J-UNIWARD的隐写代码及其原理,运用两种修改后和完善后的代码构建隐秘图像库Stego。
第二步是进行特征的提取。由于DCT特征在特征维数相对比较低的同时,具有相对更高的效率,有助于实验过程的便利及提高最终结果的成功率,所以选取DCT特征作为训练分类器的依据。我们使用残差图像的离散余弦变换(DCTR)算法分别对构建的cover和stego图像库提取信息。DCTR算法用JPEG中的DCT基来获得残差直方图,因此特征提取只需要计算64个8x8核DCT基,利用这些卷积核与解压JPEG图像卷积得到一个二维矩阵,然后将这个二维矩阵量化、截断得到子图像,最后根据这些子图像提取出直方图特征,再将这些直方图特征通过对称性原则对其进一步压缩,融合成8000维的特征向量。
第三步:因为待检测的jpeg图像可能采取两种不同的隐写算法,所以我们采用通用盲检测的方法进行检测。通用盲检测的优点是对多种类型的隐写算法有效,适应性强,经过样本学习,对未知算法或新算法有效,具有泛化能力,期间尝试应用Libjpeg提取JPEG质量因子来提高检测的正确率。同样,通用盲检测也有缺点,相对于针对特定隐写的检测算法来说,可靠性低一些,检测可靠性随嵌入信息的减少剧烈下降,检测前需要学习,需保证训练数据和测试数据统计上的一致性。我们采取集成分类器,通过集成分析投票的方式来提高检测结果的可靠性。结果是根据投票结果来确定的,投票值的大小不同表明检测对于图片是否被隐写的确定程度不同,我们认为值在0左右徘徊的是不确定的项,所以决定将投票值10以下的也认为是未隐写的图片,结果略有提高,最终正确率为0.731。
2021-03-22 09:00:35
156.65MB
隐马尔科夫模型
1