文本信息隐藏是保护文本内容安全性与完整性的重要技术。综述了中文文本信息隐藏的研究进展,根据中文文本信息隐藏的线索,将已有的算法分为3类:基于文本图像的算法、基于文本格式的算法和基于文本内容的算法,分别阐述了每类算法的实现过程,分析其优势与不足,并且对比分析了它们的原理、嵌入容量和抵抗攻击能力等。此外,总结了中文文本信息隐藏技术存在的问题,并且对其研究趋势进行展望,期望为该领域的研究提供参考。
1
通过深入分析当前针对中文的基于同义词替换的自然语言信息隐藏算法,发现由于存在大量不完全可替换的同义词词组,经过同义词替换后可能会破坏句子的语义一致性。针对这一缺点,提出了一种改进的基于同义词替换的中文文本信息隐藏算法。该算法利用知网对同义词词组进行分类,对于不完全可替换的同义词词组,通过依存句法分析来获取同义词的上下文搭配词语,根据搭配词语判断是否进行替换。实验结果表明,该算法能有效的排除错误的同义词替换,替换的准确率达到89.1%。
1