首页|基于BP_Adaboost和HMM的湖南方言识别方法研究

基于BP_Adaboost和HMM的湖南方言识别方法研究

彭湘陵

基于BP_Adaboost和HMM的湖南方言识别方法研究

彭湘陵1
扫码查看

作者信息

  • 1. 湖南师范大学
  • 折叠

摘要

汉语是目前世界上使用人数最多,分布广泛度居第二的语言,随着中国在全球影响力的增加,世界各国正在兴起一股“汉语热”。中国作为汉语使用人口数量最多的国家,随着国内经济发展的与日俱增、都市化的步伐加快,不同城市之间的人与人交流日益频繁,一些如公共信息安全、语言学工程、智能检索、公共设施等领域的完善对方言识别技术的需求越来越大,未来发展汉语方言识别技术的潜力和契机也将无限广阔。 本文着眼于非特定人孤立词对湖南地区方言进行辨识及识别。为反映方言的动态特性及其声道特性,采用LPCC、MFCC和各自一阶差分系数组合成代表方言的48维混合特征参数,提高了汉语方言识别系统的识别率和抗噪性能。本文在分析Adaboost集成、BPNN、HMM模型的基本理论及算法基础上提出了方言辨识方法和识别方法。其中一种是将BPNN和Adaboost机器学习算法相结合的汉语方言辨识方法,先利用多个BP神经网络作为弱分类器对方言进行初步辨识,再借助Adaboost迭代算法将这些BPNN合并起来构成分类精度更高的强分类器,这种方言辨识方法利用了Adaboost的自适应权值提升了BPNN的分类能力。通过建立在不同信噪比、不同特征参数、不同辨识模型情况下辨识率的对比试验,结果表明混合特征参数较其他特征参数具有更好的表征性及抗噪性,基于BPAdaboost辨识方法也具更高的辨识率。 另外一种是将隐马尔科夫模型与BPAdaboost模型相结合的汉语方言识别方法。已知按第一种方法获得到某个方言孤立词的地域信息后,然后主要利用Baum-Welch、Viterbi算法进行训练及识别,通过BPAdaboost进行第二次识别后综合得出最终结果,对比参数库中的方言标识得出其具体含义。这种混合模型充分吸收了HMM模型的时序建模能力和集成NN的强分类能力。实验结果证明,上述两种方法较BPNN或HMM方言识别方法具有更强的噪声鲁棒性和较高的识别率。

关键词

方言识别/混合特征参数/集成神经网络/HMM/BP混合模型

引用本文复制引用

授予学位

硕士

学科专业

电路与系统

导师

钱盛友

学位年度

2012

学位授予单位

湖南师范大学

语种

中文

中图分类号

TN
段落导航相关论文