首页|基于图神经网络的文档级关系抽取研究

基于图神经网络的文档级关系抽取研究

戴鹏

基于图神经网络的文档级关系抽取研究

戴鹏1
扫码查看

作者信息

  • 1. 东南大学
  • 折叠

摘要

文档实体关系抽取是自然语言处理领域的基本任务之一,文档级的实体关系蕴含于多个句子,相较于句子级的关系抽取具有更复杂的实体交互方式。论文侧重研究文档级的关系抽取,采用路径推理表示实体的复杂交互,提高实体的特征表达能力;同时,针对实际应用场景中关系标签的不平衡性和稀疏性,采用辅助学习的方式引入实体间关系存在性判断,减少无关噪声的干扰。具体工作如下: (1)实体多粒度语义的文档级关系抽取模型:面向复杂关系模式下语义特征表示的多样性改进实体特征表示的单一性问题,提出多粒度语义的关系抽取模型。将先验启发式规则通过图结构注入到样本数据中,通过图卷积网络和注意力机制表达实体的上下文全局语义和目标实体对之间的路径信息,从而建立实体间的复杂交互信息,因此提高文档级关系抽取性能。 (2)依赖路径概率增强的关系抽取模型:针对关系标签分布的稀疏性问题,该模型通过引入增强实体间依赖路径概率的辅助任务,最大化有关系实体对之间的路径概率,最小化无关实体对之间的路径概率,提高模型对存在关系的实体对的关注,减小无关实体对对图模型产生的噪声扰动。 (3)文档主题融合的层次图网络跨文档关系抽取模型:针对目标实体间关系出现在不同文档的问题,提出文档主题信息融合的层次图神经网络模型。该模型通过构建双层图神经网络,层次化地建模单个文档内的实体上下文信息和跨文档的实体间交互信息,并结合文档的主题信息,使得模型具备初步的跨文档关系抽取能力。 本文围绕文档级关系抽取问题,从不同角度提出改进模型,并在相应的文档级关系抽取数据集(DocRED)上进行实验和分析比较,实验结果表明本文模型能够提高文档级关系抽取的性能,验证所提模型在挖掘实体语义和缓解标签稀疏性问题上的有效性。

关键词

关系抽取/文档级/图神经网络/标签稀疏

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术;计算机应用技术

导师

崇志宏

学位年度

2021

学位授予单位

东南大学

语种

中文

中图分类号

TP
段落导航相关论文