基于感知哈希及数字水印的音频认证技术研究

李金凤¹

扫码查看

作者信息

1. 西南交通大学
折叠

摘要

近年来，信息科学、网络融合等研究领域新成果、新技术不断涌现，彻底改变了传统信息传递方式，多媒体数据逐渐成为互联网、广播电视、手机等信息平台中数据交互的主流形式。与此同时，针对多媒体数据的非授权拷贝、传播、融合、篡改等非法行为也日益增多，严重威胁版权所有者的产权利益和多媒体内容的可信度，对于我国全面、深入地推进知识产权保护工作造成严重阻碍。作为最早实现数字化的信息载体，数字音频的版权认证以及内容认证对于信息安全和知识产权保护具有重要意义。感知哈希和音频水印是实现数字音频认证功能的关键技术。本文围绕感知哈希和音频水印技术在认证领域的应用进行研究，针对当前存在问题给出了具体的数据保护方案。具体工作如下: 1.现有的MP3压缩域音频感知哈希算法较少，且性能上存在抗碰撞能力不足等问题，本文提出一种基于改进离散余弦变换与非负矩阵分解的音频感知哈希算法。该算法首先通过解码过程提取压缩域改进的离散余弦变换系数，利用分段和重叠对改进的离散余弦变换系数进行预处理，提高算法的鲁棒性，然后计算每个子带的能量，充分利用非负矩阵分解的性能特性生成段内和段间特征，最后通过比较均值构成二进制的感知哈希序列。仿真实验结果显示，相比Deng提出的基于频谱能量的算法及Chen等提出的基于小波分解的算法，该算法仿真得到的FAR曲线和FRR曲线的区分性更好，最大组内距离和最小组间距离的差值增加了2.5％，表明算法在区分性、抗碰撞能力上有显著提高。 2.为解决传统音频感知哈希算法对噪声敏感，计算效率低的问题，本文提出了一种基于Radon变换的音频感知哈希算法。首先，利用小波分解的多分辨率特性提取近似分量并映射为矩阵，将其作为音频信号的特征矩阵。之后，利用Radon变换的降维特性以及对噪声的不敏感特性对特征矩阵进行特征提取，再利用离散余弦变换的能量集中特性对Radon映射向量降维，最终取离散余弦变换低频系数的符号构造感知哈希序列。基于语音和音乐库对该算法进行仿真实验，结果表明，与Chen N等提出的经典算法相比，本文提出算法的熵率提高了0.22;在抵抗加性噪声攻击方面，本文提出算法的误码率最少降低了0.5％;在算法运算时间方面，本算法的计算速度提高了9.25倍以上;在抵抗重采样、重量化、低通滤波等攻击方面的鲁棒性也得到相应提高。 3.为提高传统语音内容认证算法的篡改检测能力，本文提出了一种基于梅尔频率倒谱系数相关性的语音感知哈希内容认证算法。该算法提取分段语音的声纹梅尔频率倒谱系数作为感知特征，并通过量化系数的相关值生成感知哈希序列。为提高篡改检测的准确率，在语音认证过程中，采用相似性度量函数来检测语音的篡改。仿真结果表明，该算法的熵率与对比算法相比提高了0.26,同时，在相同阈值下，该算法的误识率明显低于对比算法，对重量化、MP3压缩等语音内容保持操作的误码率也有所降低。此外，算法对语音篡改检测具有较高的灵敏性。 4.针对二值图像作为水印时易丢失、易篡改、且不唯一的问题，提出基于离散余弦变换域指纹重心感知哈希与数字水印技术的音频源认证方案。指纹图像作为生物特征之一，在身份识别中具有唯一可区分性，因此本文将指纹图像生成感知哈希序列，作为水印关联到音频数据中，以实现音频的版权保护及来源认证功能。算法首先采用随机分块方法对指纹图像进行分块，再做离散余弦变换，然后计算重心，由重心量化得到指纹图像的感知哈希。之后，利用音频水印算法将生成的指纹感知哈希序列作为水印，嵌入到音频信号的小波变换和离散余弦变换的混合域中，通过对提取的水印与指纹感知哈希库中的感知哈希序列进行对比，最终实现音频的来源认证。仿真结果表明，本文提出的感知哈希算法具有良好的可区分性，并对添加噪声具有很强的感知鲁棒性，可以抵抗20度以内的旋转攻击;此外，水印算法对加噪声、低通滤波、重采样、重量化等常规信号处理攻击具有很好的鲁棒性。 5.目前，基于能量比的音频水印算法存在不可听性较差的问题，为解决此间题，本文提出一种基于范数比值的鲁棒音频水印算法。该算法将小波变换近似系数分为两个部分，利用这两个部分p范数比值的稳定性，通过量化比值的方法嵌入水印，并通过最优化选择缩放因子修改近似系数。仿真实验证明，相比Huang等提出的基于比值的小波域水印算法，本文提出的算法提高了针对重采样以及MP3压缩攻击的鲁棒性，信噪比提升了3dB以上，表明水印的不可听性得到了较好的改善。

关键词

数字音频/版权认证/内容认证/感知哈希/数字水印

引用本文复制引用

授予学位

博士

学科专业

信息安全

导师

王宏霞

学位年度

2015

学位授予单位

西南交通大学

语种

中文

中图分类号

段落导航