首页|基于BLSTM-CTC的语音特征的音素识别研究

基于BLSTM-CTC的语音特征的音素识别研究

扫码查看
音音素是自然语言中的最小建模单元,音素识别模型的优劣直接影响关键词检索、连续语音识别的性能.本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究,发现融合幅度特征和相位特征可以取得更好的识别效果;接着比较分析了几种深度神经网络的优缺点,并将它们用于音素识别,仿真实验表明基于BLSTM-CTC的声学模型相比于其他模型具有更好的识别性能.
Research on Phoneme Recognition Based on Speech Features

吴丹丹、夏秀渝

展开 >

四川大学电子信息学院,成都 610065

音素识别 深度神经网络 语音特征

2022

现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
年,卷(期):2022.28(10)
  • 1
  • 2