首页|基于标签一致性建模的事件论元抽取方法研究

基于标签一致性建模的事件论元抽取方法研究

张付俊

基于标签一致性建模的事件论元抽取方法研究

张付俊1
扫码查看

作者信息

  • 1. 中国科学院大学
  • 折叠

摘要

事件抽取旨在从非结构化文本中抽取出结构化的事件信息,包括事件触发词、事件类型、事件论元及其角色等,是信息抽取领域中最具挑战性的任务之一。它能够帮助快速从海量互联网文本中提取出关键信息,在事件预测、事件关系推理等下游场景具有重大应用价值。而事件论元抽取,作为事件抽取的关键步骤,是整个事件抽取任务的瓶颈。因此,研究提高事件论元抽取效果的方法,对事件抽取乃至其下游任务的发展及应用具有重大意义。 现有的事件论元抽取工作在论元检测和论元角色预测两个阶段大都对候选论元的指称和角色独立进行预测,未考虑标签一致性,这导致预测出的标签之间存在矛盾、错漏等问题。此处的标签一致性分别指的是事件论元检测时的词序列标签之间以及论元角色预测时的角色标签之间的正确、相容和自洽程度。为此,本文从基于序列标注的事件论元检测方法人手,采用对比学习的方法对词标签序列一致性进行建模,从而提高论元检测的准确性。同时,本文在论元角色预测阶段将角色标签概率建模进论元特征交互过程中,并通过多轮迭代方式逐步提高各论元角色标签一致性。最后,本文设计并实现了一个标签一致性增强的事件联合抽取系统。 本文的具体贡献如下: 一、提出了一种基于序列标签一致性建模的事件论元检测方法SLCM。针对现有序列标注方法存在的词序列一致性不足且易过拟合的问题,该方法根据正确词标签序列采样生成一系列易错标签序列,然后构建了一个正确标签序列与错误序列对比学习的正则化任务,提高了词标签序列间的一致性。另外还通过序列标注任务与该任务联合学习的方式,缓解了原序列标注方法存在的标签错漏和易过拟合的问题。实验证明,该方法能够增强序列标签一致性并提高事件论元检测的效果。 二、提出了一种基于角色标签一致性建模的论元角色预测方法RLCM。针对现有方法存在的未对角色标签一致性进行建模的问题,该方法将论元的角色概率分布信息融人事件触发词与事件论元的关联特征交互中,通过多阶的图网络交互,提高论元之间角色标签的全局一致性。实验表明,该方法能够提高论元角色间的全局一致性,在保持准确率的前提下能够显著提高召回率。 三、设计并实现了一个标签一致性增强的事件联合抽取系统JLCE,并实际部署应用。该系统针对现有系统存在的论元抽取效果不佳以及管道式方法存在的误差传递问题,通过联合式框架,结合论元标签一致陛建模方法,缓解误差传递问题并提高论元抽取效果。实验表明,该系统在事件抽取各子任务上的效果均有所提高。 综上所述,本文对事件论元抽取的两个子任务分别提出了针对性的标签一致性建模方法,并结合这些方法,实现了一个标签一致性增强的事件联合抽取系统。实验及应用表明,本文提出的方法与系统能够显著提高事件论元抽取效果。

关键词

互联网文本/事件论元抽取/序列标注/标签一致性

引用本文复制引用

授予学位

硕士

学科专业

计算机应用技术

导师

靳小龙

学位年度

2022

学位授予单位

中国科学院大学

语种

中文

中图分类号

TP
段落导航相关论文