基于BP＿Adaboost和HMM的湖南方言识别方法研究

彭湘陵¹

扫码查看

作者信息

1. 湖南师范大学
折叠

摘要

汉语是目前世界上使用人数最多，分布广泛度居第二的语言，随着中国在全球影响力的增加，世界各国正在兴起一股“汉语热”。中国作为汉语使用人口数量最多的国家，随着国内经济发展的与日俱增、都市化的步伐加快，不同城市之间的人与人交流日益频繁，一些如公共信息安全、语言学工程、智能检索、公共设施等领域的完善对方言识别技术的需求越来越大，未来发展汉语方言识别技术的潜力和契机也将无限广阔。本文着眼于非特定人孤立词对湖南地区方言进行辨识及识别。为反映方言的动态特性及其声道特性，采用LPCC、MFCC和各自一阶差分系数组合成代表方言的48维混合特征参数，提高了汉语方言识别系统的识别率和抗噪性能。本文在分析Adaboost集成、BPNN、HMM模型的基本理论及算法基础上提出了方言辨识方法和识别方法。其中一种是将BPNN和Adaboost机器学习算法相结合的汉语方言辨识方法，先利用多个BP神经网络作为弱分类器对方言进行初步辨识，再借助Adaboost迭代算法将这些BPNN合并起来构成分类精度更高的强分类器，这种方言辨识方法利用了Adaboost的自适应权值提升了BPNN的分类能力。通过建立在不同信噪比、不同特征参数、不同辨识模型情况下辨识率的对比试验，结果表明混合特征参数较其他特征参数具有更好的表征性及抗噪性，基于BPAdaboost辨识方法也具更高的辨识率。另外一种是将隐马尔科夫模型与BPAdaboost模型相结合的汉语方言识别方法。已知按第一种方法获得到某个方言孤立词的地域信息后，然后主要利用Baum-Welch、Viterbi算法进行训练及识别，通过BPAdaboost进行第二次识别后综合得出最终结果，对比参数库中的方言标识得出其具体含义。这种混合模型充分吸收了HMM模型的时序建模能力和集成NN的强分类能力。实验结果证明，上述两种方法较BPNN或HMM方言识别方法具有更强的噪声鲁棒性和较高的识别率。

关键词

方言识别/混合特征参数/集成神经网络/HMM/BP混合模型

引用本文复制引用

授予学位

硕士

学科专业

电路与系统

导师

钱盛友

学位年度

2012

学位授予单位

湖南师范大学

语种

中文

中图分类号

段落导航