摘要
伴随网络技术的发展,互联网中出现越来越多的信息,这些信息中包含很多无用的知识干扰人们获取重点信息,影响工作效率。问答系统将问题进行语义化分类,能够更准确直观的返回对应的答案,提升用户体验,但是大部分问答系统是基于规则构建的,灵活性较差,且需要较多人工干预。基于知识图谱的问答系统旨在帮助网民快速、准确的获取信息,提高办事效率,它是人工智能领域中的一个重要分支。 随着深度学习技术的飞速发展,自然语言处理领域的各项研究任务都取得了重大突破。现有的知识图谱问答系统已经能够准确直接地回答简单问题,满足人们日常生活中的一些简单要求,但用户咨询问题时更倾向于在复杂问题中表达具体的信息,现有的方法在处理这类复杂问句上仍表现不佳。如何将复杂问题在知识图谱中进行有效的推理是基于知识图谱的问答系统面临的主要挑战。本文针对上述问题改进现有的知识图谱问答方法,增强方法的推理能力,提升方法问答准确率。本文的主要工作和贡献如下: (1)提出了一种融合邻居交互网络与关系识别机制的推理方法-NRQA。该方法主要解决稀疏知识图谱条件下的复杂多跳问题,利用注意力机制有选择地捕捉知识图谱中的隐藏信息并且扩展答案实体搜索范围。此外NRQA提出关系识别机制来充分利用问题中蕴含的三元组关系信息,以对候选实体做进一步的筛选。在两个公开数据集上的实验结果表明,该方法能有效的捕捉知识图谱语义信息用于问答推理,并且相比基线方法实现了更好的结果,提升了问答系统的准确率。 (2)提出了一种图对比学习知识图谱嵌入方法-GCL-KGE。该方法同时使用图注意力网络和对比学习算法聚合多阶邻居信息来优化实体表示,方法主要包括两个部分,一部分是编码器-解码器框架,另一部分是对比学习算法。编码器-解码器框架使用图注意力网络和三元组评分函数在链接预测任务中评测知识图谱嵌入效果,为了避免图注意力网络在堆叠过程中使实体表示受到噪声信息的干扰,该方法使用对比学习算法提供辅助监督信号优化知识图谱的嵌入表示。最终,在四个公开数据集上的实验结果表明GCL-KGE方法在知识图谱嵌入任务中的有效性,并且证明了对比学习算法能够削弱图注意力网络加深过程中带来的噪声干扰。 (3)经过对现实需求的分析,本文设计并实现了一个电影领域基于知识图谱的问答系统。本文提出的两种方法应用到电影问答系统中协助系统完成查询任务。该系统使用前后端分离模式,整个系统主要分为三个部分,数据模块、知识问答模块、前端展示模块。通过对系统各方面的测试结果表明,该系统返回答案的准确性和系统稳定性能满足用户的实际需求。