基于深层时延神经网络的藏语卫藏方言口语识别方法

魏建国 ¹何铭徐君海

扫码查看

作者信息

1. 天津大学
折叠

摘要

本发明涉及深度学习、信号处理、语音识别、特征提取、发音学等技术领域，为针对藏语卫藏方言的口语应用场景，提升藏语卫藏方言口语识别模型的整体效果，本发明，基于深层时延神经网络的藏语卫藏方言口语识别方法，采用三种藏语方言混合的音频数据集，通过速度扰动、添加噪音和混响的方法对原始音频数据集进行扩充，并利用扩充后的数据集基于开源的语音识别工具箱kaldi的链式chain模型训练一个深层的时延神经网络，作为藏语声学模型，利用音频数据中卫藏方言的部分对声学模型进行第二次训练，以获得针对卫藏方言的深层的时延神经网络声学模型。本发明主要应用于藏语卫藏方言口语识别场合。

申请号

CN202110183564.3

公开号

CN112951206B

专利类型

发明专利

申请日

2021-02-08

公开日

2023-03-17

IPC分类

G10L15/00(2013.01)

申请人

天津大学

发明人

魏建国/何铭/徐君海

主申请人地址

300072 天津市南开区卫津路92号

国别省市代码

中国(CN)

段落导航