首页|i-TDNN:一种基于TDNN改进的含噪声纹识别方法

i-TDNN:一种基于TDNN改进的含噪声纹识别方法

扫码查看
针对声纹识别任务在含噪背景下鲁棒性欠佳的问题,文章提出了一种基于TDNN改进的含噪声纹识别方法.该算法先提取说话人音频的梅尔频谱,利用自注意力机制(SE)使得网络更加聚焦于重要特征,引入残差连接(Res)修正梅尔频谱与输出层的特征损失信息,一定程度缓解神经网络退化的问题,使用多层特征聚合(MFA)密集连接输出特征,生成关注统计池的特征,最终生成一种强鲁棒性的声纹特征.在AISHELL-ASR0009含噪数据集进行实验表明:与Base-TDNN相比,i-TDNN算法的识别准确率提升16.63%,验证了此算法在含噪背景下的鲁棒性.
i-TDNN:An improved noise speaker recognition method based on TDNN

伍雄、陈为真

展开 >

武汉轻工大学电气与电子工程学院,湖北武汉430048

声纹识别 时延神经网络 自注意力机制 残差连接 多层特征聚合

湖北省教育厅科技项目

B2020061

2023

长江信息通信
湖北通信服务公司

长江信息通信

影响因子:0.338
ISSN:2096-9759
年,卷(期):2023.36(2)
  • 1
  • 7