现代计算机2022,Vol.28Issue(10) :32-38.DOI:10.3969/j.issn.1007-1423.2022.10.005

基于BLSTM-CTC的语音特征的音素识别研究

Research on Phoneme Recognition Based on Speech Features

吴丹丹 夏秀渝
现代计算机2022,Vol.28Issue(10) :32-38.DOI:10.3969/j.issn.1007-1423.2022.10.005

基于BLSTM-CTC的语音特征的音素识别研究

Research on Phoneme Recognition Based on Speech Features

吴丹丹 1夏秀渝1
扫码查看

作者信息

  • 1. 四川大学电子信息学院,成都 610065
  • 折叠

摘要

音音素是自然语言中的最小建模单元,音素识别模型的优劣直接影响关键词检索、连续语音识别的性能.本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究,发现融合幅度特征和相位特征可以取得更好的识别效果;接着比较分析了几种深度神经网络的优缺点,并将它们用于音素识别,仿真实验表明基于BLSTM-CTC的声学模型相比于其他模型具有更好的识别性能.

关键词

音素识别/深度神经网络/语音特征

引用本文复制引用

出版年

2022
现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
被引量1
参考文献量2
段落导航相关论文