基于区域自适应多尺度卷积的单声道语音增强算法

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：卷积神经网络的感受野大小与卷积核的尺寸相关,传统的卷积采用了固定大小的卷积核,限制了网络模型的特征感知能力;此外,卷积神经网络使用参数共享机制,对空间区域中所有的样本点采用了相同的特征提取方式,然而带噪频谱图噪声信号与干净语音信号的分布存在差异,特别是在复杂噪声环境下,使得传统卷积方式难以实现高质量的语音信号特征提取和过滤.为了解决上述问题,提出了多尺度区域自适应卷积模块,利用多尺度信息提升模型的特征感知能力;根据对应采样点的特征值自适应地分配区域卷积权重,实现区域自适应卷积,提升模型过滤噪声的能力.在TIMIT公开数据集上的实验表明,提出的算法在语音质量和可懂度的评价指标上取得了更优的实验结果.

外文标题：Monaural speech enhancement algorithm based on region-aware multi-scale convolution

作者：

王钇翔、吕忆蓝、台文鑫、孙建强、蓝天

展开 >

作者单位：

电子科技大学信息与软件工程学院,成都610054

关键词：

语音增强卷积神经网络多尺度卷积区域自适应

基金：

国家自然科学基金资助项目国家自然科学基金资助项目科技委创新特区资助项目提升政府治理能力大数据应用技术国家工程实验室重点项目中央高校基本科研业务费资助项目

项目编号：

U19820286177211719-163-21-TS-001-042-0110-2018039ZYGX2019J077

出版年：

2021

DOI：

10.19734/j.issn.1001-3695.2021.03.0131

计算机应用研究

四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心

影响因子：0.93

ISSN：1001-3695

年,卷(期)：2021.38(11)

被引量1
参考文献量1