首页|管制指令语音识别方法及应用研究

管制指令语音识别方法及应用研究

方敏

管制指令语音识别方法及应用研究

方敏1
扫码查看

作者信息

  • 1. 中国民航大学
  • 折叠

摘要

空中交通管制是空中交通管理中提供的一项空中交通服务,为确保飞行活动安全、高效、有序地继续进行,需对飞机从起飞到着陆的全过程进行管理和控制。在该过程中管制员与飞行员通常使用无线电甚高频通信,然而天气、电磁等因素会对通信信道造成干扰,使得通信质量不佳。因此,为避免沟通误差,可使用语音识别技术对管制语音进行安全检测分析,减少通信错误,确保飞行安全。 由于面向航空管制场景的语音识别还受到语音标注数据少的限制。因此,本文首先面向低资源的管制语音识别任务展开研究,提出了一个针对管制语音特性的语音识别模型。在特征表示方面,引入了语音表示学习模型wav2vec2.0加强声学特征学习,使用语音表示学习特征替代传统特征,改善模型在噪声环境下的鲁棒性。随后使用基于编码器-解码器架构的BiGRU-attention模型进行声学建模。通过BiGRU对语音上下文信息编码,并利用局部注意力机制有选择地获取编码序列中的信息,从而能够更准确地进行语音信号的识别。同时结合了迁移学习训练策略,降低模型训练对目标领域数据规模的要求。此外,考虑到管制指令语法结构的规范性,建立管制指令语法结构化模板,通过模板匹配校正算法进一步提高语音识别的准确性。实验结果表明,相较于传统特征,wav2vec2.0特征使得该模型在真实管制语音数据集上的字符错误率从9.21%降低至7.82%,有效减少了噪声扰动对模型性能带来的影响。而基于管制指令结构化模板校正算法的应用也使得字符错误率从7.82%降低至7.57%。本文最后还基于管制语音识别设计了一个指令冲突检测应用。利用语音识别模型获得指令文本,根据指令文本信息进行外推预演,并结合机场场面结构和态势评估是否存在指令冲突,为管制员决策提供参考。

关键词

管制语音识别/语音表示学习/迁移学习/特征提取

引用本文复制引用

授予学位

硕士

学科专业

电子信息硕士

导师

吕宗磊/李永亮

学位年度

2023

学位授予单位

中国民航大学

语种

中文

中图分类号

TN
段落导航相关论文