音频隐写分析技术研究综述_音频隐写算法

发布时间：2019-04-20 06:28:51 浏览数：次

　　摘要　介绍了音频隐写分析技术的原理与应用框架，概述了音频隐写分析技术的发展概况，,详细阐述了两类主要的音频隐写分析方法:专用隐写分析与通用隐写分析,并分别对其性能进行评价。针对隐写分析技术面临的几个问题进行了探讨,指出了隐写分析技术进一步的研究方向。
　　关键词　信息安全　语音　信息隐藏　隐写分析
　　随着因特网的普及、信息处理技术和通信手段的飞速发展，信息隐藏和隐藏分析技术在信息安全中的作用越来越受到人们的关注。信息隐藏是将秘密信息隐藏到载体当中传输，不被敌人发现，隐藏了消息的存在性；而隐藏分析则反之，它是通过对载体进行检测来判断载体中是否隐藏有秘密消息。
　　隐写分析的目的是为了检测秘密消息的存在，甚至提取秘密消息,隐写分析是解决非法使用隐写术问题的关键技术。近几年来由于恐怖活动越来越猖獗，所以隐写分析受到了较多的关注,获得了较大的发展,但还没有形成成熟的、系统化的理论体系。隐写分析技术的提高有利于防止隐写术的非法应用,可以起到防止机密资料流失、揭示非法信息、打击恐怖主义、预防灾难发生等作用,从而保证国家的安全和社会的稳定[1]。隐写分析不仅具有重要的应用价值,更具有重要的学术意义。隐写分析研究可以揭示当前隐写术的缺陷,对隐写术的安全性进行测试与评价,这是信息隐藏技术发展与完善的一条有效途径。
　　目前，针对图像的隐写及隐写分析研究要比音频多很多；但是音频作为载体也具有以下独特的潜力[2]：我们的听觉系统虽然很灵敏，但是还是存在时间和频率掩蔽效应，通过适当的嵌入方法，可以用来掩盖数据嵌入带来的失真；相对图像和视频，音频的处理不需要大量的计算，适合实时处理；在使用电话或手机进行通信时，少量的噪声不会引起注意和不适；人们对图像的隐写比较警觉，相对而言，语音隐藏更不容易被发现。
　　1.2　隐写分析模型
　　在隐写分析过程中，首先待测音频信号输入后进行特征提取，然后根据音频信号的特征是否被改变以及改变的程度来判别音频信号是否隐藏信息。因为在秘密信息嵌入音频信号后，会引起音频信号某些特征的变化，我们在隐写分析时只要把握音频特征的变化来判断隐藏音频中是否含有秘密信息，特征变化也是在隐藏分析中判断秘密信息存在的重要依据。
　　2　语音隐写分析现状
　　根据特征提取与嵌入算法的关系，语音隐写分析有两条途径，一是针对某种具体的嵌入方法提取其专有特征，根据这些专有特征进行判别，可称为专用隐写分析技术；二是寻找独立于具体的嵌入算法之外的特征根据这些特征进行判别，可称为通用隐写分析技术。
　　2.1　语音专用隐写分析方法
　　专用的隐写分析方法是针对特定的隐藏方法来对隐藏信息进行分析的，其优点是检测准确率高，相应的缺点是特定的隐写分析方法对别的隐藏方法进行检测时，准确率就会很低。该类检测方法一般针对某一种或某一类隐写算法,通过载体对象与载密对象的统计分析，寻找二者之间具有强区分能力的统计特征，利用这些统计特征的差异去设计相应的检测算法。结合相应的隐写算法，根据针对性的不同可分为针对空间域的检测与针对变换域的检测。
　　2.1.2　针对空间域的检测
　　在语音隐写分析方面，典型的LSB（Least Significant Bit）隐写分析方法有Chi-Square、RS、抽样对分析方法等[5]。
　　卡方检测（Chi-Square test）是一种统计攻击的方法该方法的原理是把隐秘对象的理论期望频率分布和从可能被修改的载体中观察到样本分布进行比较，从而找出差异，检测是否有信息嵌入。LSB算法通常直接将音频样本值的最后一位用秘密信息取代，也就是说，如果秘密信息位与隐藏该位的样本值最后一位相同，则不改变原始载体反之，则要改变样本值的最后一位，LSB隐写会改变样本值直方图，从而可以检测到载体中是否隐藏有秘密信息。
　　RS（Regular and Singular）分析方法考虑的起点是图像各个位平面之间具有一定的非线性相关性，而当利用隐藏信息后，这种相关性将被破坏。只要能找出衡量这一相关性的方法，并对隐藏信息前后的情况加以对比，就有可能设计出隐写分析方法。与图像类似，音频信号同样具有空间相关性。通过判断音频的空间相关系来确定载体中是否隐藏有秘密信息。
　　SPA（Sample Pairs Analysis）算法是基于对抽样对及其有限状态机分析的隐写分析方法，该方法的本质是基于随机性特征的高阶统计分析。状态机分析是将载体数据之间的某种相互关系定义为状态，分析隐写操作引起的状态改变，并建立统计特征。方法分析了某些特殊抽样对之间的相关性，得到不同抽样对子集之间的相互关系，并通过分析不同抽样对子集在隐藏信息前后的状态转换，建立了抽样对子集的封闭的有限状态机，并可以进一步从该有限状态机求得隐写嵌入率。
　　2.1.2　针对变换域的检测
　　针对变换域的检测主要集中于DCT算法的检测[6]。变换时一般将语音载体分割成小段，然后按照DCT变换公式计算出DCT系数，把信息隐藏在DCT系数中，然后做DCT反变换回空间域。提取时分别计算原始语音载体数据和嵌入隐藏信息后语音数据的离散余弦变换（或不需要原始载体数据），比较每个语音段DCT系数中约定位置的系数值，根据其相对大小进行判断，从而来判定语音载体中是否含有隐藏信息。
　　由于变换域算法将数据由空间域变换到频域，数据之间的相关性消失，因而在频域上改变数值再变换到空间域后其鲁棒性大大加强，当遭遇到攻击后仍能提取到隐藏信息。
　　DCT域内嵌入隐藏信息后，其DCT系数的统计特性发生改变，因而，大多数DCT域内的隐写分析都是围绕DCT系数统计特性的变化情况进行研究的。
　　（1）卡方检测
　　（2）针对F5算法的隐写分析算法
　　由于F5密写算法在信息嵌入前后数据的DCT系数的直方图基本不改变，因而卡方检测不适用。针对F5算法的特点提出的隐写分析算法，将可疑对象数据进行裁减，如果有隐藏信息，则裁减后数据直方图发生变化，由此判断。　　在空间域和频域内，载体数据嵌入隐藏信息后，其统计特性发生改变，因而基于统计的隐写分析方法是目前隐写分析技术的主流研究方向，随着隐写分析技术的发展，抗隐写分析的隐藏算法也随之产生并迅速发展，对隐写分析提出了新的挑战。
　　3.2　语音通用隐写分析方法
　　通用检测的一般思路是选取检测对象的多个特征统计量，由统计量构成特征矢量集，再利用神经网络、聚类算法、回归分析或者其他软件计算工具从试验数据中构造检测模型，在检测模型中经过训练寻找最佳判决门限，利用这一检测模型作为载体对象与载密对象的分类器。该类检测方法的检测对象一般是针对多类隐藏方法或多种隐藏工具，例如同时针对空域的LSB算法与变换域的LSB算法，以及扩频的隐藏方法，这也是“通用”的意义所在[7]。
　　通用测法包含两个重要步骤:学习过程与判决过程[8]，如图3。学习过程包括从未嵌入秘密信息的语音样本和嵌入秘密信息的语音样本中提取并选择有利于分类的特征矢量，以此构造隐写分析分类器，并对分类器进行训练，直到满足一定的精度要求。判决过程是则是利用在学习过程中建立的分类器对待测语音进行分类，这样，即使不知道隐写算法，也可以通过比较和分析学习样本，观察出由于消息嵌入而对待测语音产生的影响，从而提取出可用于分类的特征，最终判决待测音频是否有隐藏秘密信息。
　　该模型中，分类特征的选择非常重要，它强烈地影响到分类器的设计与性能。如果对不同类别样本所选的特征差别较大，则比较容易设计出高性能的分类器，反之，则有可能使分类器难于构造或分类效果不好。因此，隐写分析系统成功的关键就是选取利于分类的有效特征。
　　汝学民等人提出的一种利用语音高阶矩作为特征的隐写分析方法，并用支持向量机（SVM）进行了分类，取得了一定的效果，但其特征的维数过高并且特征之间有很强的相关性，因而增加了分类的难度。
　　Jian-Wen Fu等提出了利用语音小波域的直方图及其频域高阶统计矩作为特征的隐写方法，并利用PCA对选特征进行降维，利用S V M 对特征进行进行分类。该方法对三种不同的嵌入方法，包括小波域LSB、小波系数量化QIM 和小波域迭加有效。
　　4　展望
　　经过近几年的发展,隐写分析技术已形成了一个理论体系，取得了一批研究成果，但仍有许多问题有待解决，今后有待突破的方向包括针对改进的高安全性的隐写算法的检测、综合型的隐写检测算法设计、检测对象的分类技术研究等。
　　目前主要的两类检测方法：强针对性的检测方法与通用盲检测法，都是基于对检测对象的统计模型的统计分析，二者各有优劣。前者针对性强，对具体的一类隐藏算法检测结果可靠度高,能估计出隐藏信息量的大小，但灵活性与扩展性较差；而后者具有一定的通用性，一般对多种隐藏方法有效，灵活性与扩展性较好，但检测结果的可靠性与准确性与前者相比较差。在进一步的研究中可将二者优势互补，设计综合型的检测算法。一方面利用通用盲检测法的优势，构造多种特征统计量，建立更为全面的检测对象的统计模型；另一方面采用强针对性的检测方法的思路，具体考察所构造的统计量对不同的隐藏类型的统计变化，寻找对新的隐藏算法适用的检测统计量，并参考通用检测法的分类技术，确定更为鲁棒的判决门限，以提高检测的可靠性与准确性。
　　另一个有待研究的方向是对检测对象的分类技术，常用的分类技术有神经网络，支持向量机等方法。集成学习是一种新的机器学习范式[9]，它使用多个（通常是同质的）分类器来解决同一个问题。在语音隐写分析中，我们也可以用集成学习技术，将多个分类器联合起来，对待测语音进行分类，分类效果会更好，判断的结果会更加准确。
　　现阶段隐写分析技术的研究主要集中在检测技术的研究，要达到实用化就必须实现隐蔽信息的提取与还原，其中将涉及到密码技术，这方面的研究也开始受到人们的关注。
　　参考文献
　　[1] KELLEY J. Terror groups hide behind Web encryption[N].USA Today,Feb.2007,http://www.usatoday.com/tech/news/
　　2007-02-05-binladen.htm.
　　[2] 郭立，杨帆. MIDI 音频隐写分析研究[D].北京:中国科学技术大学.2009.
　　[3] 陈　铭,张　茹,钮心忻,杨义先. 隐写分析技术研究概述[J].计算机应用,2008,28(06):31-33.
　　[4] KATZENBEISSER S, PETITCOLAS F A P. Defining security in steganographic systens[C]// Proceedings of 2002 Security and Watermarking of Multinedia Contents .CA:SPIE.2002,4675:50-56.
　　[5] 杨正琴.音频隐写分析技术的研究[D].南京：南京理工大学.2006
　　[6] 饶华一,陈铭,张茹,钮心忻. 信息隐藏和隐写分析综述[C]//2007北京地区高校研究生学术交流会通信与信息技术会议论,北京:北京邮电大学出版,2008.
　　[7] 惠卯卯.基于变换域特征的通用隐写分析[D]. 无锡:江南大学.2009.
　　[8] 戚银城，付建文，苑津莎. 基于直方图统计矩特征的小波域音频隐写分析[J].系统仿真学报,2008,20（07）:1912-1914.
　　[9] 李凯, 崔丽娟.集成学习算法的差异性及性能比较[J].计算机工程，2008, 34(6):35-37.

推荐访问:技术研究综述音频分析