国家学术搜索
登录
注册
中文
EN
首页
|
i-TDNN:一种基于TDNN改进的含噪声纹识别方法
i-TDNN:一种基于TDNN改进的含噪声纹识别方法
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
针对声纹识别任务在含噪背景下鲁棒性欠佳的问题,文章提出了一种基于TDNN改进的含噪声纹识别方法.该算法先提取说话人音频的梅尔频谱,利用自注意力机制(SE)使得网络更加聚焦于重要特征,引入残差连接(Res)修正梅尔频谱与输出层的特征损失信息,一定程度缓解神经网络退化的问题,使用多层特征聚合(MFA)密集连接输出特征,生成关注统计池的特征,最终生成一种强鲁棒性的声纹特征.在AISHELL-ASR0009含噪数据集进行实验表明:与Base-TDNN相比,i-TDNN算法的识别准确率提升16.63%,验证了此算法在含噪背景下的鲁棒性.
外文标题:
i-TDNN:An improved noise speaker recognition method based on TDNN
收起全部
展开查看外文信息
作者:
伍雄、陈为真
展开 >
作者单位:
武汉轻工大学电气与电子工程学院,湖北武汉430048
关键词:
声纹识别
时延神经网络
自注意力机制
残差连接
多层特征聚合
基金:
湖北省教育厅科技项目
项目编号:
B2020061
出版年:
2023
长江信息通信
湖北通信服务公司
长江信息通信
影响因子:
0.338
ISSN:
2096-9759
年,卷(期):
2023.
36
(2)
被引量
1
参考文献量
7