摘要
大数据时代,互联网上的信息与日俱增,人们对于信息的获取也提出了更高要求。在军事指挥数字化,军事装备现代化进程不断推进的背景之下,如何对军事信息进行有效的提炼、管理和利用,对于提高军事知识的应用以及军事资源的利用效率研究具有重大意义。因此,本课题以军事装备领域作为研究切入点,基于知识图谱技术构建了一个军事装备智能问答系统。本课题的主要工作包括: (1)采集并解析军事武器网站的半结构化数据,构建军事装备知识图谱本体,对数据的字段信息进行标准化,将数据处理成实体、属性和属性值以及实体、关系、实体的三元组形式,再将三元组数据导入到Neo4j中,构建出军事装备知识图谱。 (2)将知识图谱问答划分为命名实体识别和属性链接两个主要子过程。使用双向长短时记忆网络(BiLSTM)和条件随机场(CRF)完成命名实体识别任务,为解决传统实体识别算法使用静态词向量,无法表征同一单词在不同语境下的语义,采用了BERT语言模型编码词向量,将BERT-BiLSTM-CRF模型应用于军事装备命名实体识别过程。将属性链接过程转化为句对分类问题,采用BERT的句对分类微调模型解决这一问题。并对这两个子过程分别进行实验,结果表明本文所采用算法能较好地完成任务。 (3)设计并实现了基于知识图谱的军事装备问答系统。在所构建的军事装备领域知识图谱的基础上,结合相关的智能问答算法,实现了基于知识图谱的军事装备问答系统,能够回答用户提出的军事装备领域问题。