首页|基于双向循环神经网络的汉语语音识别

基于双向循环神经网络的汉语语音识别

A study of Chinese speech recognition based on bidirectional recurrent neural network

扫码查看
当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用.针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别.构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构.实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势.

李鹏、杨元维、高贤君、杜李慧、周意、蒋梦月、张净波

展开 >

长江大学地球科学学院 武汉 430100

语音识别 深度学习 深度神经网络 循环神经网络

湖北省教育厅科学研究计划资助项目长江大学大学生创新创业基金地理国情监测国家测绘地理信息局重点实验室开发基金

Q2018131720180122017NGCM07

2020

应用声学
中国科学院声学研究所

应用声学

CSTPCDCSCD北大核心
影响因子:1.128
ISSN:1000-310X
年,卷(期):2020.39(3)
  • 8
  • 2