首页|基于深度学习的噪声环境下语音识别系统实现与并行优化

基于深度学习的噪声环境下语音识别系统实现与并行优化

白亮

基于深度学习的噪声环境下语音识别系统实现与并行优化

白亮1
扫码查看

作者信息

  • 1. 国防科技大学
  • 折叠

摘要

语音作为信息媒介,在生活中扮演着重要的角色。目前,纯净语音条件下,语音识别系统的精度已经很高了。然而在实际场景中,语音信号很容易受到来自背景或者其他地方的噪声干扰,语音识别系统的性能在噪声环境中急剧下降。因此提高语音识别系统的抗噪声能力就很有价值和研究意义了。而如何从含噪语音中尽可能地去除噪声,提取出近似纯语音是语音增强研究所关注的问题。本文首先对语音识别的流程以及相关技术进行了深入分析,重点对语音识别模型分析研究。经过分析对比,选择使用循环神经网络作为识别模型,并予以并行优化,获得了3倍的加速比。然后深入研究几种传统语音增强方法,对比各自的优缺点。结合深度学习,阐述了基于GAN的语音增强方法,该方法无需估计噪声信号的能量信息,并且没有对语音信号的分布进行任何假设该方法。将其运用到语音增强中,与传统的语音增强方法相比,其整体去噪效果比较好,然后使用小波分析解决低信噪比下语音增强问题。基于前面的研究,构建了基于语音増强具有抗噪能力的语音识别系统。实验结果表明,将语音增强用于抗噪声语音识别是有效的。

关键词

语音识别/噪声环境/深度学习/语音增强

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

窦勇

学位年度

2018

学位授予单位

国防科技大学

语种

中文

中图分类号

TN
段落导航相关论文