国家学术搜索
登录
注册
中文
EN
首页
|
基于经验模态分解特征拼接的重放语音检测研究
基于经验模态分解特征拼接的重放语音检测研究
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
现有的重放语音检测方法的性能不够理想,缺乏对未知攻击检测的泛化能力.为此,提出一种方法,首先使用经验模态分解将语音信号分解为不同频段的内涵模态函数(Intrinsic Mode Function,IMF)分量,其次对多个分量分别提取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征,并将所得的多个二维IMF-MFCC特征在分量的维度上拼接起来得到三维IMF-MFCC特征,最后为提取三维特征分量维度上蕴含的重放痕迹设计了一种3D-ResNet网络.实验结果表明,所提的模型在面对未知重放攻击检测时泛化能力更强.与ASVspoof2019挑战赛的重放语音检测基线系统相比,所提模型以EER和t-DCF衡量的性能分别提升了55.01%和54.72%.
外文标题:
Research on Replayed Speech Detection Based on Empirical Mode Decomposition Feature Splicing
收起全部
展开查看外文信息
作者:
王雷鸣
展开 >
作者单位:
宁波大学信息科学与工程学院,浙江宁波 315210
关键词:
经验模态分解
重放语音检测
ResNet
出版年:
2022
DOI:
10.16311/j.audioe.2022.04.009
电声技术
电视电声研究所(中国电子科技集团公司第三研究所)
电声技术
影响因子:
0.259
ISSN:
1002-8684
年,卷(期):
2022.
46
(4)
参考文献量
10