国家学术搜索
登录
注册
中文
EN
首页
|
基于BLSTM-CTC的语音特征的音素识别研究
基于BLSTM-CTC的语音特征的音素识别研究
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
万方数据
维普
中文摘要:
音音素是自然语言中的最小建模单元,音素识别模型的优劣直接影响关键词检索、连续语音识别的性能.本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究,发现融合幅度特征和相位特征可以取得更好的识别效果;接着比较分析了几种深度神经网络的优缺点,并将它们用于音素识别,仿真实验表明基于BLSTM-CTC的声学模型相比于其他模型具有更好的识别性能.
外文标题:
Research on Phoneme Recognition Based on Speech Features
收起全部
展开查看外文信息
作者:
吴丹丹、夏秀渝
展开 >
作者单位:
四川大学电子信息学院,成都 610065
关键词:
音素识别
深度神经网络
语音特征
出版年:
2022
DOI:
10.3969/j.issn.1007-1423.2022.10.005
现代计算机
中大控股
现代计算机
影响因子:
0.292
ISSN:
1007-1423
年,卷(期):
2022.
28
(10)
被引量
1
参考文献量
2