首页|基于深层时延神经网络的藏语卫藏方言口语识别方法

基于深层时延神经网络的藏语卫藏方言口语识别方法

魏建国 何铭 徐君海

基于深层时延神经网络的藏语卫藏方言口语识别方法

魏建国 1何铭 徐君海
扫码查看

作者信息

  • 1. 天津大学
  • 折叠

摘要

本发明涉及深度学习、信号处理、语音识别、特征提取、发音学等技术领域,为针对藏语卫藏方言的口语应用场景,提升藏语卫藏方言口语识别模型的整体效果,本发明,基于深层时延神经网络的藏语卫藏方言口语识别方法,采用三种藏语方言混合的音频数据集,通过速度扰动、添加噪音和混响的方法对原始音频数据集进行扩充,并利用扩充后的数据集基于开源的语音识别工具箱kaldi的链式chain模型训练一个深层的时延神经网络,作为藏语声学模型,利用音频数据中卫藏方言的部分对声学模型进行第二次训练,以获得针对卫藏方言的深层的时延神经网络声学模型。本发明主要应用于藏语卫藏方言口语识别场合。

申请号

CN202110183564.3

公开号

CN112951206B

专利类型

发明专利

申请日

2021-02-08

公开日

2023-03-17

IPC分类

G10L15/00(2013.01)

申请人

天津大学

发明人

魏建国/何铭/徐君海

主申请人地址

300072 天津市南开区卫津路92号

国别省市代码

中国(CN)
段落导航相关论文