光电子·激光2022,Vol.33Issue(6) :620-628.DOI:10.16136/j.joel.2022.06.0632

基于CRNN混合神经网络的多语种识别

Multilingual recognition based on CRNN hybrid neural network

王瑶 龙华 邵玉斌 杜庆治 王延凯
光电子·激光2022,Vol.33Issue(6) :620-628.DOI:10.16136/j.joel.2022.06.0632

基于CRNN混合神经网络的多语种识别

Multilingual recognition based on CRNN hybrid neural network

王瑶 1龙华 1邵玉斌 1杜庆治 1王延凯1
扫码查看

作者信息

  • 1. 昆明理工大学信息工程与自动化学院,云南昆明650500
  • 折叠

摘要

在语种识别过程中,为提取语音信号中的空间特征以及时序特征,从而达到提高多语种识别准确率的目的,提出了一种利用卷积循环神经网络(convolutional recurrent neural network,CRNN)混合神经网络的多语种识别模型.该模型首先提取语音信号的声学特征;然后将特征输入到卷积神经网络(convolutional neural network,CNN)提取低维度的空间特征;再通过空间金字塔池化层(spatial pyramid pooling layer,SPP layer)对空间特征进行规整,得到固定长度的一维特征;最后将其输入到循环神经网络(recurrenrt neural network,CNN)来判别语种信息.为验证模型的鲁棒性,实验分别在3个数据集上进行,结果表明:相比于传统的CNN和RNN,CRNN混合神经网络对不同数据集的语种识别准确率均有提高,其中在8语种数据集中时长为5 s的语音上最为明显,分别提高了 5.3%和6.1%.

关键词

语种识别/卷积循环神经网络混合神经网络/卷积神经网络/循环神经网络

引用本文复制引用

基金项目

国家自然科学基金(61761025)

出版年

2022
光电子·激光
天津理工大学 中国光学学会

光电子·激光

CSCD北大核心
影响因子:1.437
ISSN:1005-0086
参考文献量4
段落导航相关论文