摘要
随着互联网的快速发展以及网络信息的爆发式增长,如何快速高效地理解和利用网络中的信息成为人们关注的热点。知识图谱技术在这个环境下应运而生,它将网络中的数据抽取成事实三元组的形式,并可以广泛地应用在人工智能、信息检索等多个领域。在知识图谱的构建中,实体关系抽取和知识图谱补全是其中的两个重要子任务。本文针对实体关系抽取和知识图谱补全展开研究。 首先,针对基于深度学习的远程监督抽取方法引入噪声数据的问题,本文提出了基于正负实例交互的实体关系抽取模型(PNIIM)。该模型先将远程监督方法标注的数据集输入到多规则联合的数据筛选器中划分出正负实例集,用正负实例集不断地迭代训练关系抽取器,在不断地迭代的过程中重新划分正负实例集;当关系抽取模型达到最终的稳定状态时,负实例集的数据即作为噪声数据剔除,用保留下来的正实例集作为训练集来训练一个高质量的关系抽取器。 其次,针对现有知识图谱补全方法中很多模型只考虑了单一的三元组信息,忽略了三元组在知识图谱中的子图语义结构信息的问题,本文提出了融合子图卷积和张量分解的知识图谱补全模型(SCTD)。该模型获取待预测实体所在的子图语义结构信息并使用改进的子图卷积神经网络对其进行处理;设置系统参数将子图卷积模块与张量分解模块进行融合,对补充的三元组进行打分;选取分数最高的三元组作为可信的新三元组补充到原知识图谱中。 最后,分别在不同的公开数据集上对所提出的PNIIM模型和SCTD模型进行了实验对比分析,验证本文所提方法的有效性和优越性。