语音识别中声学模型研究综述

Summary of Acoustic Models in Speech Recognition

叶硕 ¹褚钰 ¹王祎 ¹李田港¹

扫码查看

作者信息

1. 武汉邮电科学研究院,湖北武汉 430000
折叠

摘要

智能语音技术包含语音识别、自然语言处理、语音合成三个方面的内容,其中语音识别是实现人机交互的关键技术,识别系统通常需要建立声学模型和语言模型.神经网络的兴起使声学模型数量急剧增加,基于神经网络的声学模型与传统识别模型相结合的方式,极大地推动了语音识别的发展.语音识别作为人机交互的前端,具有许多研究方向,文中着重对语音识别任务中的文本识别、说话人识别、情绪识别三个方向的声学模型研究现状进行归纳总结,尽可能对语音识别技术的演化进行细致介绍,为以后的相关研究提供有价值的参考.同时对目前语音识别的主流方法进行概括比较,介绍了端到端的语音识别模型的优势,并对发展趋势进行分析展望,最后提出当前语音识别任务中面临的挑战.

关键词

语音识别/声学模型/神经网络/深度学习

引用本文复制引用

基金项目

2018年度湖北省科学技术创新专项重大项目(2018AAA063)

出版年

2020

计算机技术与发展

陕西省计算机学会

计算机技术与发展

CSTPCD

影响因子：0.621

ISSN：1673-629X

被引量4

参考文献量8

段落导航