首页|基于图表示学习的知识图谱检索研究

基于图表示学习的知识图谱检索研究

夏航宇

基于图表示学习的知识图谱检索研究

夏航宇1
扫码查看

作者信息

  • 1. 中国科学院大学
  • 折叠

摘要

随着互联网的发展,人们对知识的获取需求日益增长,知识图谱上的检索是满足人们知识获取需求的重要途径。近年来研究者将图表示学习算法引入知识图谱检索领域,它的方法是通过表示学习算法为图的实体节点学习低维的、融合了属性特征和结构特征的表示向量,再利用表示向量计算节点之间的相似度,根据相似度的大小返回查询结果,缓解了部分传统检索算法过于偏重实体属性作为检索依据的问题,有效地提升了检索的语义准确度。 然而,在基于图表示学习的知识图谱检索领域中,因为大多数图表示学习算法往往为图数据中的节点学习欧几里得空间中的连续实数值表示向量,所以在使用这些连续实数值向量计算节点的相似度时需要进行浮点数的算数运算,带来了较大的时间开销,同时增加了存储负担,降低了基于图表示学习的节点检索方法在工程中的实用性。 针对目前存在的问题,本文对基于图表示学习的知识图谱检索展开研究,依次在算法、方法和系统层面做出了如下贡献: 1.针对连续值图表示学习向量用于检索时带来的计算开销较大的问题,本文提出了一种基于神经网络的属性图二值表示学习算法。该算法借助特征聚合算法和神经自编码器,结合松弛量化的参数学习机制,在融合图结构特征和属性特征的基础上学习了每个节点的二值向量,利用二值向量之间的位运算得到的汉明距离来计算节点相似度。实验结果显示,使用二值向量的算法相比于使用连续实数值向量的算法降低了计算的时间与存储消耗,提升了检索的效率。 2.本文进一步提出了基于图表示学习的知识图谱节点检索方法。该方法用于对知识图谱进行节点检索,包含了预处理、查询节点表示、节点召回、节点排序等环节。在分析了各个环节计算开销的基础上,本文将提出的属性图二值表示学习算法用于开销占比最大的节点召回环节,使用二值向量计算节点的相似度对全局数据进行筛选。实验结果证明,该方法能够在保持一定程度的检索准确度的同时降低检索整体流程的计算开销。 3.本文基于提出的属性图二值表示学习算法研制了一款知识图谱检索原型系统。遵照常规的软件开发流程,本文完成了需求分析,设计了包括前端、服务器、数据库在内的系统架构并将提出的属性图二值表示学习算法进行部署。除此之外,本文还在项目中集成了文本检索、结构化查询语言Cypher检索等模块,进一步提高了系统的实用性。 综上,本文聚焦于基于图表示学习的知识图谱检索领域,提出一种可以用于图节点检索的属性图二值表示学习算法,围绕该算法设计了一种节点检索方法,并基于该方法搭建了一个基于图表示学习的知识图谱检索原型系统,实证了通过图表示学习算法得到的向量具有强大的表征能力,不仅可以用于节点检索,对于优化知识图谱检索中的时间消耗、存储空间等性能问题也有很大帮助。

关键词

图表示学习/知识图谱/信息检索/原型系统

引用本文复制引用

授予学位

硕士

学科专业

网络空间安全

导师

高能

学位年度

2021

学位授予单位

中国科学院大学

语种

中文

中图分类号

TP
段落导航相关论文