首页|面向高速铁路道岔故障维修领域的知识图谱研究与应用

面向高速铁路道岔故障维修领域的知识图谱研究与应用

卢冉

面向高速铁路道岔故障维修领域的知识图谱研究与应用

卢冉1
扫码查看

作者信息

  • 1. 兰州交通大学
  • 折叠

摘要

高速铁路道岔作为高速列车运营过程中的关键地面信号设备,在高速列车实际运行的过程中,其一旦发生故障会对高速铁路运行的效率和安全产生极大影响。因此,高速铁路道岔的故障维修需要充分发挥技术优势,依托大数据研究高速铁路道岔故障维修方法,辅助高速铁路道岔维护人员进行故障维修,以提高维修效率。 高速铁路多年来的运营积累,产生了大量以自然语言方式记录的高速铁路道岔故障文本数据。但当前针对道岔故障维修领域非结构化文本数据的研究,未能充分挖掘出数据中蕴含着丰富的故障知识,仅仅是根据故障诊断结果进行粗略定位,并不能表示出道岔故障时各要素之间的复杂联系。为解决上述问题,本文将知识图谱技术应用至道岔故障维修领域,以高速铁路道岔故障文本数据集为基础,通过知识图谱技术挖掘出道岔故障各要素之间的内部联系,提高维修效率。论文的主要研究内容如下: (1)构建高速铁路道岔故障实体识别语料库。在命名实体识别的初期,需要具有标注好的数据集,但当前高速道岔故障维修领域并没有公开的标注好的数据集,因此本文首要任务就是构建高速铁路道岔故障语料库。首先定义了8种故障实体类型,后续采用“精灵标注助手”软件对高速道岔故障数据集进行文本序列标注,最后将数据处理成实体识别模型允许输入的BIO格式,从而实现高速铁路道岔故障实体识别语料库的构建。 (2)建立高速铁路道岔故障维修领域实体识别模型。利用构建完成的高速铁路道岔故障语料库作为实验数据集,建立BERT-BiLSTM-CRF命名实体识别模型,模型首先通过基于Transformer的预训练语言模型(Bi-directional Encoder Representations from Transformers,BERT)获取上下文语义信息的高质量词向量表示,其次将BERT获取到的词向量输入至双向长短时记忆神经网络(Bi-direction Long Short Term Memory,BiLSTM),从而学习上下文语义特征,并为各类标签打分,最后将得分标签序列通过条件随机场(Conditional Random Field,CRF)模型增加约束,输出最优标签序列。通过实验分析,本文建立的实体识别模型的精确率、召回率、F1值分别达到93.41%、92.93%和93.17%。并且通过对比实验显示,本文模型在以上三种指标上均优于其他实体识别模型。 (3)提出基于规则的高铁道岔故障实体关系抽取方法。为提升领域知识图谱的质量,采用基于规则的关系抽取方法,在道岔维修领域专家的指导下,根据故障数据集的特点制定关系抽取的规则模板,最后再请领域内的不同专家按照制定的规则利用置信度打分的方式进行实体间的关系判断。该方法虽然是人工进行关系抽取,但是抽取规则以及关系判断均由领域专家指导,抽取的关系正确性高,能显著提高知识图谱知识质量。 (4)构建高速铁路道岔故障维修领域知识图谱。构建的领域知识图谱分为命名实体识别、关系抽取、知识融合和知识存储四个步骤,在知识融合部分,运用了知识融合的关键技术——实体对齐,利用基于文本相似度与语义相似度算法分别实现了结构相似的同义故障实体与结构相似但语义不同的故障实体的对齐。根据实体识别、关系抽取以及知识融合得到三元组数据结果,构建高速铁路道岔故障维修领域知识图谱,利用Neo4j图数据库实现知识储存和图谱可视化呈现。 最后设计基于高速铁路道岔故障维修领域知识图谱的自动问答系统。该系统基于FastAPI的web框架下开发,实现了问题解析功能、查询语句生成功能、数据库连接功能、答案转化功能、界面显示功能。用户可以使用此系统完成故障类型的识别、找到故障间的内在联系和隐含知识、提供维修措施的建议。系统有效的辅助了工作人员对高铁道岔故障的维护,推动现场工作更加高效地运转。

关键词

高速铁路道岔/故障维修/文本数据/实体关系抽取/知识图谱/自动问答系统

引用本文复制引用

授予学位

硕士

学科专业

交通运输

导师

林海香;马腾云

学位年度

2023

学位授予单位

兰州交通大学

语种

中文

中图分类号

TP
段落导航相关论文