摘要
因果关系的识别与抽取在NLP任务中是一项重要且具有挑战性的任务,旨在识别出具有因果关系的文本并对其进行因果实体对的抽取。由于当前金融领域因果关系识别与抽取过程中存在特征信息缺失的问题,导致实验中识别和抽取的准确率较低。为了解决这个问题,本文提出以Bi-LSTM与双路CNN网络模型BTCNN(Bi-LSTMandTwo-wayCNN)为基础进行因果关系的识别,并提出了基于注意力机制(Transformer)的图卷积网络(T-GCN)的因果关系抽取模型使其更适合于因果关系抽取任务。具体研究内容如下: (1)提出一种结合Bi-LSTM与双路CNN的因果关系识别模型(BTCNN)用于充分挖掘文本中隐含的因果语义信息,以解决在识别过程中存在特征信息缺失的问题。首先,利用Bi-LSTM网络模型生成文本特征矩阵;然后,通过双路CNN设置不同的卷积核对文本特征矩阵中的因果特征进一步提取,将采用两种不同池化方式(平均池化和最大池化)训练的特征向量进行拼接;最后,将特征向量输入到全连接层进行输出。与已知方法相比,实验显示BTCNN模型提高了因果关系识别的准确率。 (2)在BTCNN模型进行因果关系识别的基础上,引入T-GCN模型用于强化因果语义特征,以减少因果关系抽取过程中特征信息的缺失。首先,以Bi-LSTM+CRF作为基准模型,对文本进行词向量编码后输入到Bi-LSTM层并初步生成因果特征向量。同时将词向量输入到Transformer模型,得到各个独立单词之间的关联程度。然后,将初步生成的因果特征向量依据单词间的关联程度,通过T-GCN重新获取权重,进一步强化因果语义特征以减少特征信息的缺失。最后,将强化后的因果特征向量输入到CRF层并得到因果标签。 实验结果显示,本文所提出的BTCNN识别模型相较于其它模型在OIECAA数据集上其准确率、召回率、F值均取得最大值,分别为82.3%,80.04%和81.15%。在进行因果关系实体对抽取的过程中,本文所提模型与基准模型Bi-LSTM+CRF相较,其准确率和召回率上分别提高了3.4个百分点和3.6个百分点。