首页|知识图谱补全和实体对齐方法研究

知识图谱补全和实体对齐方法研究

马强

知识图谱补全和实体对齐方法研究

马强1
扫码查看

作者信息

  • 1. 杭州电子科技大学
  • 折叠

摘要

随着人工智能技术的飞速发展和数据量的爆炸性增长,知识图谱作为连接和组织大量语义知识,并提供深层次语义理解的关键技术,已广泛应用于推荐系统、智能搜索和自然语言处理等领域。在构建和扩展知识图谱的过程中,知识图谱补全和知识图谱实体对齐是两项至关重要的技术,它们能够显著提高知识图谱的质量和完整性。这两项技术相辅相成,不仅能扩大知识图谱的覆盖范围和提高准确性,还能为智能问答、个性化推荐等下游应用提供更丰富和准确的知识支持,从而满足更广泛的用户和场景需求。 知识图谱补全,当前研究在小样本场景下旨在通过不同的技术架构和假设来从已有的知识图谱结构和少量样本中挖掘和预测缺失的信息,从而丰富知识图谱的内容,但仍存在不能较好处理数据噪声邻居、实体角色多样性以及数据稀疏性等问题。为此,本文提出了一种基于度量学习的小样本知识图谱补全模型,以提高补全预测的准确性。知识图谱实体对齐,当前研究致力于堆叠网络架构和利用图结构的关联性来识别不同知识图谱中表示相同实体的节点,并整合来自不同来源的知识,增强知识图谱的互联互通和信息的一致性。然而,泛化能力不足、结构异质性以及模型比较复杂等问题仍亟待解决。因此,本文提出了一种基于图增强的知识图谱实体对齐模型,以更好的融合图谱中的相关信息。本文研究工作分为如下三个部分: (1)本文提出了一种基于度量学习的小样本知识图谱补全模型( Gated Attention and Knowledge Distillation Network,GAKDN)。该模型通过一个门控和角色感知的邻居聚合器精细处理实体信息,其中利用门控注意力机制优化邻居选择以减少噪声邻居影响,然后通过Bi-LSTM加注意力机制的角色识别网络精确捕获实体角色以缓解实体角色多样性的影响,并进一步通过Transformer蒸馏网络深化实体间复杂关系的理解,以此来缓解数据稀疏问题。最终,GAKDN通过灵活的匹配器高效补全知识图谱,显著提升了小样本环境下知识图谱补全的准确性。 (2)本文提出了一种基于图增强的知识图谱实体对齐模型( Knowledge Distillation Enhanced Entity Alignment with Graph Augmentation,KDEA-GA)。该模型通过图增强技术,在源图和目标图上进行删边操作并引入对比损失,以此在训练阶段创建多样化的图视图,增加图结构的多样性,进而帮助模型更准确地理解不同邻居节点的语义重要性,有效提升了模型的泛化能力。进一步,KDEA-GA将知识蒸馏技术融入实体关系编码器(ER Encoder),知识蒸馏能够深入挖掘实体和关系的深层特征,同时编码器中的SPGAT组件能够优化实体嵌入的学习过程,以应对结构异质性的问题。这些创新方法和设计,使得KDEA-GA模型在降低模型复杂度的同时,提升了知识图谱实体对齐任务的准确性。 (3)为了验证GAKDN模型的有效性,本文在2个公开数据集NELL-One和Wiki-One上进行了实验。实验结果表明,与其他模型相比,本文提出的模型具有更好的补全预测精度。为了验证KDEA-GA模型的有效性,本文在4个公开数据集(EN-FR-15K、EN-DE-15K、D-W-15K、D-Y-15K)上进行了实验,实验结果表明,与其他模型相比,本文提出的模型具有更好的对齐预测结果。

关键词

知识图谱/元学习/知识蒸馏/小样本补全/实体对齐

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

周仁杰

学位年度

2024

学位授予单位

杭州电子科技大学

语种

中文

中图分类号

TP
段落导航相关论文