国家学术搜索
登录
注册
中文
EN
首页
|
基于LSTM-RNN的多目标深度学习语音增强
基于LSTM-RNN的多目标深度学习语音增强
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
在这项研究中,我们探索了用于语音增强的长短期记忆循环神经网络(LSTM-RNN).首先,提出了一种从噪声到清晰语音特征的直接映射的回归LSTM-RNN方法,并被证明比基于深度神经网络(DNN)的回归技术在建模长期声学环境方面更为有效.然后,对建议的基于直接映射的LSTM-RNN和基于理想比率掩码(IRM)的LSTM-RNN进行了全面比较.我们观察到,直接映射框架在低信噪比(SN-R)时可实现更好的语音清晰度,而IRM方法在高SNR时显示出其优越性.因此,为了充分利用这种互补性,设计了一种新颖的多目标联合学习方法.在看不见的噪音下进行的实验表明,所提出的框架可以一致且显着改善语音质量和清晰度的客观指标.
收起全部
展开查看外文信息
作者:
李子珩
展开 >
作者单位:
华侨大学计算机科学与技术学院 福建 厦门361021
关键词:
语音增强
长短期记忆递归神经网络
直接映射
理想比率掩码
多目标联合学习
出版年:
2020
IT经理世界
信息产业部电子科技情报研究所
IT经理世界
ISSN:
1007-9440
年,卷(期):
2020.
23
(2)
参考文献量
4