首页|基于经验模态分解特征拼接的重放语音检测研究

基于经验模态分解特征拼接的重放语音检测研究

扫码查看
现有的重放语音检测方法的性能不够理想,缺乏对未知攻击检测的泛化能力.为此,提出一种方法,首先使用经验模态分解将语音信号分解为不同频段的内涵模态函数(Intrinsic Mode Function,IMF)分量,其次对多个分量分别提取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征,并将所得的多个二维IMF-MFCC特征在分量的维度上拼接起来得到三维IMF-MFCC特征,最后为提取三维特征分量维度上蕴含的重放痕迹设计了一种3D-ResNet网络.实验结果表明,所提的模型在面对未知重放攻击检测时泛化能力更强.与ASVspoof2019挑战赛的重放语音检测基线系统相比,所提模型以EER和t-DCF衡量的性能分别提升了55.01%和54.72%.
Research on Replayed Speech Detection Based on Empirical Mode Decomposition Feature Splicing

王雷鸣

展开 >

宁波大学信息科学与工程学院,浙江宁波 315210

经验模态分解 重放语音检测 ResNet

2022

电声技术
电视电声研究所(中国电子科技集团公司第三研究所)

电声技术

影响因子:0.259
ISSN:1002-8684
年,卷(期):2022.46(4)
  • 10