计算机研究与发展2023,Vol.60Issue(1) :153-166.DOI:10.7544/issn1000-1239.202110767

图卷积增强多路解码的实体关系联合抽取模型

Graph Convolution-Enhanced Multi-Channel Decoding Joint Entity and Relation Extraction Model

乔勇鹏 于亚新 刘树越 王子腾 夏子芳 乔佳琪
计算机研究与发展2023,Vol.60Issue(1) :153-166.DOI:10.7544/issn1000-1239.202110767

图卷积增强多路解码的实体关系联合抽取模型

Graph Convolution-Enhanced Multi-Channel Decoding Joint Entity and Relation Extraction Model

乔勇鹏 1于亚新 2刘树越 王子腾 夏子芳 乔佳琪
扫码查看

作者信息

  • 1. 东北大学计算机科学与工程学院 沈阳 110169
  • 2. 医学影像智能计算教育部重点实验室(东北大学)沈阳 110169
  • 折叠

摘要

从无结构化自然语言文本中抽取实体关系三元组是构建大型知识图谱中最为关键的一步,但现有研究仍存在3方面问题:1)忽略文本中因多个三元组共享同一实体而产生的实体关系重叠问题;2)当前以编码器-解码器为基础的联合抽取模型未充分考虑文本语句词之间的依赖关系;3)部分三元组序列过长导致误差累积与传播,影响实体关系抽取的精度和效率.基于此,提出基于图卷积增强多路解码的实体关系联合抽取模型(graph convolution-enhanced multi-channel decoding joint entity and relation extraction model,GMCD-JERE).首先,基于BiLSTM作为模型编码器,强化文本中词的双向特征融合;其次,通过图卷积多跳特征融合句中词之间的依赖关系,提高关系抽取准确性;此外,改进传统模型按三元组先后顺序的解码机制,通过多路解码三元组机制,解决实体关系重叠问题,同时缓解三元组序列过长造成误差累积、传播的影响;最后,实验选用当前3个主流模型进行性能验证,在NYT(New York times)数据集上结果表明在精确率、召回率和F1这3个指标上分别提升了 4.3%,5.1%,4.8%,同时在WebNLG(Web natural language generation)数据集上验证以关系为开始的抽取顺序.

关键词

关系抽取/编码器-解码器/多路解码/关系重叠/图卷积神经网络

引用本文复制引用

基金项目

国家自然科学基金(61871106)

国家自然科学基金(61973059)

国家重点研发计划(2016YFC0101500)

出版年

2023
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量2
参考文献量6
段落导航相关论文