计算机应用研究2021,Vol.38Issue(11) :3264-3267.DOI:10.19734/j.issn.1001-3695.2021.03.0131

基于区域自适应多尺度卷积的单声道语音增强算法

Monaural speech enhancement algorithm based on region-aware multi-scale convolution

王钇翔 吕忆蓝 台文鑫 孙建强 蓝天
计算机应用研究2021,Vol.38Issue(11) :3264-3267.DOI:10.19734/j.issn.1001-3695.2021.03.0131

基于区域自适应多尺度卷积的单声道语音增强算法

Monaural speech enhancement algorithm based on region-aware multi-scale convolution

王钇翔 1吕忆蓝 1台文鑫 1孙建强 1蓝天1
扫码查看

作者信息

  • 1. 电子科技大学信息与软件工程学院,成都610054
  • 折叠

摘要

卷积神经网络的感受野大小与卷积核的尺寸相关,传统的卷积采用了固定大小的卷积核,限制了网络模型的特征感知能力;此外,卷积神经网络使用参数共享机制,对空间区域中所有的样本点采用了相同的特征提取方式,然而带噪频谱图噪声信号与干净语音信号的分布存在差异,特别是在复杂噪声环境下,使得传统卷积方式难以实现高质量的语音信号特征提取和过滤.为了解决上述问题,提出了多尺度区域自适应卷积模块,利用多尺度信息提升模型的特征感知能力;根据对应采样点的特征值自适应地分配区域卷积权重,实现区域自适应卷积,提升模型过滤噪声的能力.在TIMIT公开数据集上的实验表明,提出的算法在语音质量和可懂度的评价指标上取得了更优的实验结果.

关键词

语音增强/卷积神经网络/多尺度卷积/区域自适应

引用本文复制引用

基金项目

国家自然科学基金资助项目(U1982028)

国家自然科学基金资助项目(61772117)

科技委创新特区资助项目(19-163-21-TS-001-042-01)

提升政府治理能力大数据应用技术国家工程实验室重点项目(10-2018039)

中央高校基本科研业务费资助项目(ZYGX2019J077)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量1
参考文献量1
段落导航相关论文