摘要
近年来,随着网络技术的迅速发展,人们对数据有了越来越多的关注。海量的数据需要更高效的处理方法进行筛选。文本情感分类任务由此应运而生。方面级文本情感分类任务是文本情感分类任务的一大分支,也是当前研究的热点问题。当前的研究存在两个问题:一是,大多数研究采用序列化研究方法,只能提取方面词附近的信息,对于长距离信息无法获取,而当前已有的同构图模型只利用了单词之间的信息,忽略了其他重要信息;二是,当前模型未建立方面之间的联系,导致句子中的方面无法互相传递信息。 针对上述两个问题,本文提出基于异构图卷积网络的方面级文本情感分类模型,主要研究内容如下:对于第一个问题,本文设置了不同的节点和边对句子整体建模,提出了异构图的结构,设置三类不同节点类型和五种边关系。数据集中的每条数据单独成图。该图结构充分利用了句子的信息。对于第二个问题,图中设置了方面之间的边,使句子中所有方面节点建立联系,挖掘出方面与方面之间存在隐性关系。 本文提出的异构图卷积网络模型由六部分组成。首先将每条数据分割,并对应不同节点,使用初始词嵌入向量进行表示,经双向长短期记忆神经网络(Bi-LSTM),获取初步的上下文表示向量结构;然后将图表示矩阵输入到图卷积网络(GCN)中,全部节点经过两层GCN网络,得到具有文本特征的向量表示;其次经过方面掩码和注意力层,得到有关方面的最终表示;最后由输出层得到最终分类结果。 为证明本文算法模型的有效性,本文使用了四个公开数据集进行验证。通过实验,证明对四个数据集分别有不同程度的提高,充分证明了本文提出的异构图卷积网络模型对方面级文本情感分类任务的有效性。