IT经理世界2020,Vol.23Issue(2) :91.

基于LSTM-RNN的多目标深度学习语音增强

李子珩
IT经理世界2020,Vol.23Issue(2) :91.

基于LSTM-RNN的多目标深度学习语音增强

李子珩1
扫码查看

作者信息

  • 1. 华侨大学计算机科学与技术学院 福建 厦门361021
  • 折叠

摘要

在这项研究中,我们探索了用于语音增强的长短期记忆循环神经网络(LSTM-RNN).首先,提出了一种从噪声到清晰语音特征的直接映射的回归LSTM-RNN方法,并被证明比基于深度神经网络(DNN)的回归技术在建模长期声学环境方面更为有效.然后,对建议的基于直接映射的LSTM-RNN和基于理想比率掩码(IRM)的LSTM-RNN进行了全面比较.我们观察到,直接映射框架在低信噪比(SN-R)时可实现更好的语音清晰度,而IRM方法在高SNR时显示出其优越性.因此,为了充分利用这种互补性,设计了一种新颖的多目标联合学习方法.在看不见的噪音下进行的实验表明,所提出的框架可以一致且显着改善语音质量和清晰度的客观指标.

关键词

语音增强/长短期记忆递归神经网络/直接映射/理想比率掩码/多目标联合学习

引用本文复制引用

出版年

2020
IT经理世界
信息产业部电子科技情报研究所

IT经理世界

ISSN:1007-9440
参考文献量4
段落导航相关论文