摘要
本发明涉及深度学习、信号处理、语音识别、特征提取、发音学等技术领域,为针对藏语卫藏方言的口语应用场景,提升藏语卫藏方言口语识别模型的整体效果,本发明,基于深层时延神经网络的藏语卫藏方言口语识别方法,采用三种藏语方言混合的音频数据集,通过速度扰动、添加噪音和混响的方法对原始音频数据集进行扩充,并利用扩充后的数据集基于开源的语音识别工具箱kaldi的链式chain模型训练一个深层的时延神经网络,作为藏语声学模型,利用音频数据中卫藏方言的部分对声学模型进行第二次训练,以获得针对卫藏方言的深层的时延神经网络声学模型。本发明主要应用于藏语卫藏方言口语识别场合。