基于BLSTM-CTC的语音特征的音素识别研究

扫码查看

原文链接

万方数据
维普

中文摘要：音音素是自然语言中的最小建模单元,音素识别模型的优劣直接影响关键词检索、连续语音识别的性能.本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究,发现融合幅度特征和相位特征可以取得更好的识别效果;接着比较分析了几种深度神经网络的优缺点,并将它们用于音素识别,仿真实验表明基于BLSTM-CTC的声学模型相比于其他模型具有更好的识别性能.

外文标题：Research on Phoneme Recognition Based on Speech Features

作者：

吴丹丹、夏秀渝

展开 >

作者单位：

四川大学电子信息学院,成都 610065

关键词：

音素识别深度神经网络语音特征

出版年：

2022

DOI：

10.3969/j.issn.1007-1423.2022.10.005