国家学术搜索
登录
注册
中文
EN
首页
|
面向突发事件的因果关系抽取研究
面向突发事件的因果关系抽取研究
引用
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
中文摘要:
在如今海量信息的时代,事件作为人们认知世界的基本单元,它们间存在着包含因果在内的各种语义关系。挖掘事件间的因果关系是对事件深度理解的必然要求,尤其是在突发类事件中,因为其发生的突然性,往往对社会造成不可估量的损失,所以准确的抽取突发事件中的因果关系对于预防突发事件和制定应对决策具有重要意义。目前的突发事件因果关系抽取研究中,经常存在着词特征不符合上下文语境,以及由于突发类事件文本中因果信息不足导致的因果关系边界识别效果较差的问题,本文通过分析该类事件的特点,利用深度学习技术和事件相关特征对因果关系的抽取进行研究。针对词特征不符文本语境的问题,本文首先提出了一种基于ELMO-BiGRU-Attention的因果关系抽取模型,并在此模型的基础上,考虑到因果关系边界的识别效果较差的问题,又提出了一种基于多特征和CNN-BiGRU-Attention的因果关系抽取模型。本文研究内容主要包含以下两个方面: (1)基于ELMO-BiGRU-Attention模型的因果关系抽取研究。该模型中,首先,在词向量表示方面,通过引入ELMO词嵌入模型对预处理后的词序列进行表示,生成关联语境的动态词特征,再与word2vec模型表示的词向量融合,成为联合词向量,以解决词特征不符合语境的问题;然后,联合词向量传到由BiGRU(bidirectionalGateRecurrentUnit,门控循环单元)和注意力机制结合构成的网络层,先经过BiGRU层抽取全文语义特征,再经注意力机制层对特征分配权重,得到加权特征;最后,将加权特征放入softmax分类器进行分类,完成突发事件因果关系的抽取。实验最终取得了88.56%的F1值,表明利用该模型抽取突发事件的因果关系,能够丰富词汇特征信息,取得较好的抽取效果。 (2)基于多特征和CNN-BiGRU-Attention模型的因果关系抽取研究。在模型(1)的基础上,考虑到突发类事件文本中还存在着因果信息不足导致因果关系边界识别效果较差的问题,结合本文抽取的三种突发事件特征和CNN(ConvolutionalNeuralNetwork,卷积神经网络),提出了基于多特征和CNN-BiGRU-Attention的抽取模型。首先,在对语料库预处理时,分析该类事件的特点,抽取出事件的触发词、发生的时间顺序和因果指示词三种特征,并按照不同的权重融合成多特征向量,以丰富因果语义特征:然后,与模型(1)中生成的联合词向量共同作为模型的输入,先经CNN抽取事件文本的局部语义特征,后经BiGRU抽取全局语义特征,再由注意力机制对特征加权;最后,利用softmax对加权特征进行分类从而完成抽取。在模型训练方面,本文还提出了一种基于误差反馈的学习算法,可以使模型在训练中进行权重自调整,以此优化模型训练。实验取得了91.86%的F1值,结果表明该模型在突发事件因果关系抽取上取得了理想的效果。
收起全部
展开查看外文信息
作者:
王旭
展开 >
关键词:
因果关系抽取
突发事件
联合词向量
BiGRU网络
注意力机制
授予学位:
硕士
学科专业:
软件工程
导师:
廖涛
学位年度:
2022
学位授予单位:
安徽理工大学
语种:
中文
中图分类号:
TP