摘要
巡检机器人是维护电网系统稳定可靠运行的重要设备,而导航系统能否可靠工作直接决定着巡检机器人能否正常运行。目前巡检机器人自主导航过程中还存在诸多痛点需要攻克,研发人员需搜集专业领域知识,针对性地制定方案。然而大量多源的导航领域文本数据没能得到挖掘,导致知识利用效率低下。对此,本文搜集与处理多源领域知识,构建巡检机器人导航领域知识图谱,在此基础上开展应用研究。本文的主要内容包括: (1)巡检机器人导航领域多源文本知识抽取。分析领域内关键知识特征,自顶向下构建基础本体。获取多源数据,确定标准、专利与故障案例为知识抽取对象,针对具体信息构建细粒度的本体层,采用基于 Bert 预训练模型的命名实体识别算法和基于提示学习的关系抽取算法分别对非结构化文本进行知识抽取。针对长实体难以识别的问题应用字符修正的方法,提升了长实体识别准确率。 (2)基于BerTopic的导航领域文本主题提取。针对领域文本缺乏分类的问题,使用 BerTopic 主题模型进行基于语义向量的主题提取。对于主题提取过程中 HDBSCAN 算法将大量领域文本归为离群值的问题,采用多种策略减少离群值,使用领域专利摘要进行实验,最终以主题连贯性为指标确定基于K-Means算法的分类方法,并以此实现对领域专利的主题划分,提取出主题词提供检索便利。 (3)导航领域知识图谱构建及推理方法研究。将多源文本中抽取出的实体与关系导入Neo4j图数据库,完成导航领域知识图谱构建。在此基础上,针对专利之间缺乏联系的问题,基于Jaccard相似度提出一种结合摘要实体词和主题信息的相似专利推荐算法。针对故障案例缺少重用机制的问题,参考CBR范式,融合 S-Bert 模型的语义相似度计算方法,提出一种对故障解决方案重用的推理方法,并以实例验证该方法对故障推理的实用性。 (4)巡检机器人导航领域知识服务系统的设计与开发。基于上述工作,设计并开发系统为巡检机器人导航系统研发人员提供知识服务。 本研究使用知识图谱相关技术,解决了巡检机器人导航领域知识利用效率低的问题,为领域知识图谱的构建和应用提供借鉴与参考。