基于深度学习的噪声环境下语音识别系统实现与并行优化

白亮¹

扫码查看

作者信息

1. 国防科技大学
折叠

摘要

语音作为信息媒介，在生活中扮演着重要的角色。目前，纯净语音条件下，语音识别系统的精度已经很高了。然而在实际场景中，语音信号很容易受到来自背景或者其他地方的噪声干扰，语音识别系统的性能在噪声环境中急剧下降。因此提高语音识别系统的抗噪声能力就很有价值和研究意义了。而如何从含噪语音中尽可能地去除噪声，提取出近似纯语音是语音增强研究所关注的问题。本文首先对语音识别的流程以及相关技术进行了深入分析，重点对语音识别模型分析研究。经过分析对比，选择使用循环神经网络作为识别模型，并予以并行优化，获得了3倍的加速比。然后深入研究几种传统语音增强方法，对比各自的优缺点。结合深度学习，阐述了基于GAN的语音增强方法，该方法无需估计噪声信号的能量信息，并且没有对语音信号的分布进行任何假设该方法。将其运用到语音增强中，与传统的语音增强方法相比，其整体去噪效果比较好，然后使用小波分析解决低信噪比下语音增强问题。基于前面的研究，构建了基于语音増强具有抗噪能力的语音识别系统。实验结果表明，将语音增强用于抗噪声语音识别是有效的。

关键词

语音识别/噪声环境/深度学习/语音增强

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

窦勇

学位年度

2018

学位授予单位

国防科技大学

语种

中文

中图分类号

段落导航