计算机研究与发展2023,Vol.60Issue(7) :1639-1648.DOI:10.7544/issn1000-1239.202220129

基于跨维度协同注意力机制的单通道语音增强方法

Monaural Speech Enhancement Based on Cross-Dimensional Collaborative Attention Mechanism

康宏博 冯雨佳 台文鑫 蓝天 吴祖峰 刘峤
计算机研究与发展2023,Vol.60Issue(7) :1639-1648.DOI:10.7544/issn1000-1239.202220129

基于跨维度协同注意力机制的单通道语音增强方法

Monaural Speech Enhancement Based on Cross-Dimensional Collaborative Attention Mechanism

康宏博 1冯雨佳 1台文鑫 1蓝天 1吴祖峰 1刘峤2
扫码查看

作者信息

  • 1. 电子科技大学信息与软件工程学院 成都 610054
  • 2. 电子科技大学计算机科学与工程学院 成都 611731
  • 折叠

摘要

近年来,卷积神经网络在语音增强任务中得到了广泛的应用.然而,目前广泛使用的跳跃连接机制在特征信息传输时会引入噪声成分,从而不可避免地降低了去噪性能;除此之外,普遍使用的固定形状的卷积核在处理各种声纹信息时效率低下,基于上述考虑,提出了一种跨维度协同注意力机制和形变卷积模块的端到端编-解码器网络CADNet.具体来说,在跳跃连接中引入跨维度协同注意力模块,进一步提高信息控制能力.并且在每个标准卷积层之后引入形变卷积层,从而更好地匹配声纹的自然特征.在TIMIT公开数据集上进行的实验验证了所提出的方法在语音质量和可懂度的评价指标方面的有效性.

关键词

语音增强/自注意力/跨维度协同注意力/形变卷积/跳跃连接

引用本文复制引用

基金项目

国家自然科学基金(U19B2028)

国家科技重大专项(2021YFC3330403)

中国电子科技集团54所开放课题(201148)

攀钢集团有限公司开放课题(211129)

出版年

2023
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
参考文献量42
段落导航相关论文