摘要
知识图谱(KnowledgeGraph,KG)是一种结构化的语义网络,通常以三元组的形式来存储真实世界中的事实数据,在知识问答、推荐系统和智能搜索等领域具有重要的研究意义。随着知识图谱规模的不断扩大,知识图谱中普遍存在知识缺失的现象,这种现象严重影响了知识图谱在诸多应用领域中所发挥的效能。因此,如何对缺失的知识进行补全成为知识图谱领域亟待解决的问题,此类任务被称为知识图谱补全(KnowledgeGraphCompletion,KGC)。知识图谱补全旨在根据知识图谱中已经存在的知识推理出缺失的部分,从而提高知识图谱的完整性。近年来,知识表示学习(KnowledgeRepresentationLearning,KRL)的发展很大程度上提升了知识图谱补全的效率,该方法旨在将知识图谱中的实体和关系表示为低维的向量。由于这类方法具有较高的计算效率和缓解数据稀疏性的能力,因此,基于知识表示学习的知识图谱补全算法成为知识图谱领域的研究热点。目前,研究者已经提出了很多基于知识表示学习的知识图谱补全算法,这些算法很好地解决了知识缺失的问题,但仍存在以下不足:(1)现有的方法无法同时对复杂关系和多源信息进行编码。(2)现有的方法在利用实体邻域信息进行表示学习时,忽略了实体之间的关系信息。针对以上问题,本文的主要研究内容如下: (1)本文提出了一种基于可信路径邻域与多重关系映射的超平面知识图谱补全方法(TransPMH)。针对复杂关系的编码,TransPMH引入了实体之间的多重关系的映射属性,定义一个特定于关系类型的权重来区分三元组中头实体和尾实体之间的复杂关系;针对多源信息的编码,融合实体的路径邻域信息,与三元组的结构信息相结合进行表示学习,通过一个邻域路径权重来衡量路径包含的有效信息,并对可信的路径进行筛选,以提高模型的计算效率。 (2)本文提出了一种基于实体邻域与关系图注意力网络的超平面知识图谱补全方法(TransENH-RGAT)。TransENH-RGAT引入了图结构信息实体邻域来提高模型对知识的表示能力。对于给定的三元组,TransENH-RGAT首先利用TransH对三元组中的实体和关系进行基本嵌入表示,然后在超平面上构建中心实体的混合邻域表示,最后引入了关系图注意力网络计算每个不同的邻域实体对中心实体的重要性,将关系信息嵌入到中心实体中,对传统的注意力机制做进一步的改进。 本文在Freebase的两个子集FB15K和FB13以及WordNet的两个子集WN18和WN11基准数据集上进行了知识图谱补全的相关实验,如链接预测和三元组分类等。实验结果表明,本文提出的两个方法在多个评价指标上达到了最好的实验效果,验证了所提方法的有效性。