摘要
随着互联网和社交媒体的高速发展,人们可以在网上发表自己的观点。但是这些评论信息存在高冗余、内容广、形式多等问题,想要了解大众对某产品或某事件的看法仍然存在很大的挑战。因此,如何对用户评论中的情感极性进行快速精准的提取,成为学术界的一大研究热点。情感分析,也被叫做立场检测或观点挖掘,是人们对某实体观点的表达,旨在让机器根据特定的上下文确定情感极性。针对不同颗粒度进行划分,可将其分为三个方面:文档级、句子级和方面级。针对短文本的特点,颗粒度更小的方面级情感分析更加契合。本文的主要贡献有以下三点: (1)针对传统文本并行计算、特征提取能力不足,为解决文本内容省略和缺失的问题,本文提出了一种基于词共现特征信息和依存句法信息的短文本特征提取算法。首先,基于依存关系和依存句法规则构建文本特征;接着,根据词共现特征信息,由相关公式去计算语义相似度,从而构建文本特征集;最终,深度神经网络相关模型被引入以验证文本特征提取的可行性。实验表明,基于共现矩阵构建的文本特征集可以增强特征提取的能力,有效提升方面级情感分析的性能。 (2)在传统短文本情感分析中,存在方面词与上下文关联度较低,不能充分挖掘与方面词相关隐含信息的问题,本文提出了一种基于多特征融合的方面级情感分析模型。首先,由词嵌入Word2Vec得到向量矩阵,接着将它们输入到Bi-LSTM中,得到上下文的语义信息和文本方面词表征信息。但由于缺少特定方面对句子的关注,将其输入到注意力机制中,得到优化后的特定方面表示。接着,将前文中基于共现矩阵构建的文本特征集作为先验知识,将它和经过注意力机制优化后的数据相结合,输入到CNN中,可以更好的结合上下文中的局部情感信息表征。最后由分类器输出结果。实验结果表明,本文提出的算法模型在情感分析任务中的表现更为突出。 (3)针对现有的方面级情感分析模型不能很好的融合句法信息和词共现信息。本文提出了一种融合辅助信息的图卷积神经网络模型。首先,将前文得到的文本特征信息和句法信息输入到Bi-GCN中进行卷积,可以得到融合信息;然后,将这些融合信息输入到Bi-LSTM层,可以得到文本中上下文的语义特征信息和不同方面词的表征信息。最后,将模型融合注意力机制层,从而可以计算出新的方面特征向量。实验结果显示,该模型可以有效处理方面级情感分析任务。最后,根据消融实验可以看出,图卷积神经网络、词共现信息和位置信息均对方面级情感分析起重要作用。