摘要
随着计算设备和移动终端的发展,互联网的数据量日益庞大,使用智能系统解决复杂问题的需求愈发凸显。知识图谱作为一种结构化的知识数据库,由于其与数字系统良好的兼容性,在知识推理中得到广泛的应用。由于知识图谱先天的不完整性,我们需要进行知识图谱补全以发现缺失的三元组或发掘潜在关系。知识图谱补全问题存在很多挑战,例如语义网络的快速发展使知识图谱的更新频率显著提高,使传统静态方法难以应用;幂律分布特性使通识知识图谱实体存在长尾分布,为实体预测带来困难;一词多意以及上下文敏感性导致的语义混淆影响多跳关系推理的准确性。 针对知识图谱更新频率高以及长尾分布的特点,本文提出了一种基于强化学习的动态知识图谱补全算法,该算法通过关系网络构成的子图进行按需式实体语义信息生成,并使用基于强化学习的路径搜索完成关系推断。通过对路径搜索的应用,该算法能够直接利用知识图谱的图结构信息,摆脱对新实体的文本描述的依赖。同时,路径搜索固有的多跳关系推理能力能够较好完成长尾分布实体的补全任务。 针对动态环境下路径搜索效率退化且易受语义混淆影响的问题,本文提出了一种改进的路径搜索方法,提升了动态知识图谱补全算法的性能。具体地,针对路径搜索效率退化的问题,本文提出了路径搜索的回滚机制以及基于回滚机制的多重路径搜索策略,提高路径搜索的效率,扩大智能体搜索范围,提升了搜索方法的成功率;针对路径搜索易受语义混淆影响的问题,本文设计了一个适用于动态知识图谱的层次化知识图谱特征构建模块,该方法使用连续布局生成算法和基于密度的自适应动态聚类算法进行实体聚类,随后使用语义相似度以及最小生成树构建层次化特征结构。结合层次化的知识图谱查询机制,通过层次化的特征提供上下文语义信息,消除歧义,降低了语义混淆问题的影响。 本文在常用静态和动态知识图谱补全数据集上进行了测试,与现有静态和动态知识图谱补全方法进行比较,并对结果进行分析,验证了本文方法的有效性。