摘要
知识图谱表示学习的目的是将知识图谱中的实体和关系嵌入到连续低维向量空间中,以便在保留知识图谱结构的同时提升下游机器学习任务的性能。但已有的知识表示学习方法大多仅将工作重心放在表示三元组中的结构化信息,而忽略了语义信息对于知识表示学习的重要性。本文将从关系层次结构和实体类型这两类语义信息入手并分别提出对应的知识表示学习方法。 关系层次结构,是由关系间的泛化关系subRelationOf构建而成的结构。本文提出TransRHS模型将这一语义信息高效融入到知识表示学习中。具体来说,TransRHS模型将每个关系表示为位于同一空间的多维向量和与关系一一对应的多维球体,并通过向量和球的相对位置来建模关系层次结构信息。 实体类型是能够表明实体所属类别的语义信息。一般地,一个实体有多个类型,但在给定的关系中,头、尾实体的类型是确定的,因此同一个实体在不同的场景下中应该表现出不同的性质。受此启发,本文提出基于实体类型的知识表示学习模型TransET。具体来说,每个实体类型被编码为一个投影矩阵,然后通过矩阵对实体一般表示的映射实现对实体类型信息的建模。 本文使用链接预测和三元组分类这两个典型的知识表示学习任务对Tran-sRHS模型和TransET模型进行实验评估,实验结果显示这两个模型的表现要远好于现有知识表示学习方法,其中TransRHS模型在各项指标提升幅度为20%至50%;TransET模型在各项指标提升幅度为5%至40%。以上理论分析和实验结果表明关系层次结构和实体类型这两类语义信息对知识图谱表示学习的各项性能指标有显著的提升,相比于现有知识表示学习方法,以上两个模型能够有效地将这两类语义信息融入到知识表示学习中。