摘要
随着互联网的飞速发展,数据呈现爆炸式增长,知识图谱因提供了高效的组织、管理、理解数据的手段,成为实现人工智能的关键技术之一。但知识图谱受到人工构建成本高、信息抽取技术不完善的制约,大多数知识图谱存在数据缺失的问题。知识推理技术通过学习、分析知识图谱中的已知事实,推理补全知识图谱中潜在隐藏的事实,极大地解决了数据缺失的问题。然而,现有的知识推理技术大多忽略了知识图谱中事实发生的时间信息,难以有效的利用知识图谱的时序特征发现潜在的事实,制约了知识图谱的发展与应用。本文在知识推理技术的基础上,分析与挖掘知识图谱网络结构随时间推移的演化规律,基于神经网络对时序知识图谱推理技术进行研究。主要研究内容及创新点如下: (1)针对单一方法难以从庞大的知识图谱中获取有效蕴含信息的问题,提出基于层次特征提取的时序知识推理模型(HierarchicalFeatureExtractionfortemporalknowledgegraphreasoning,HFE),分层次提取时序知识图谱的语义特征、结构特征和时序特征。首先,针对知识图谱实体和关系的初始嵌入缺失语义信息的问题,使用TransE模型获取满足事实约束的实体和关系嵌入;然后,基于知识库图注意力网络学习实体的多跳邻域信息,提取知识图谱每一个时间步的结构特征;接着,通过双向长短期记忆网络学习图谱的演化规律,提取时序特征并更新嵌入向量;最后,基于评分函数进行训练并完成时序知识图谱推理补全任务。在时序知识图谱公开数据集中进行实验,HFE模型在MRR、Hits@3和Hits@10等评价指标中均优于对比模型。 (2)针对实体在时序知识图谱不同时间步中活跃度不同,且知识图谱中的部分事件会在不同的时间步中重复发生的现象,提出基于实体活跃度和复制机制的时序知识推理模型(EntityActivityandCopyMechanismfortemporalknowledgegraphreasoning,EACM)。首先,通过关系图卷积神经网络提取知识图谱每一个时间步的结构特征;然后,基于实体在时序知识图谱不同时间步中的活跃程度更新实体的权重以学习更有效的知识,并使用门控循环单元提取知识图谱的时序特征;最后,统计并学习知识图谱中事件发生的频率信息,基于复制机制更新不同时间步中实体的嵌入向量。实验结果表明,EACM模型在ICEWS14、ICEWS05-15和GDELT等三个数据集的MRR、Hits@3和Hits@10评价指标上优于当前主流方法,证明了实体活跃度和复制机制可提升模型推理能力。