摘要
随着互联网各种社交媒体、电商平台的发展,越来越多的用户在这些平台上发表评论。分析互联网平台上的文本数据对用户和平台都有极大的价值,同时也会对方面级情感分析任务的发展有极大的促进作用。 方面级情感分析的目的是为了识别文本中的方面项,并通过学习上下文文本信息来判断这些方面项的情感极性。本文对现有的方面级情感分析的解决方法进行深入分析后发现现有的情感分析的算法存在如下问题。首先,现有的方面级情感分析任务多数只描述情感分类这个子任务,模型较单一,很少说明方面项的提取任务,且在方面项提取任务中忽略了方面项邻近上下文信息的重要性以及与词性特征相关信息。其次现存的方面级情感分析算法模型对上下文文本和方面项的依赖关系学习不够,忽略方面项和上下文文本语境的联系。针对以上问题本文主要的研究内容如下: (1)提出了一种基于混合神经网络的方面项抽取模型来解决方面级情感分析任务中方面项抽取这个问题,该模型使用预训练语言模型来学习文本的词向量表示,然后将卷积神经网络和双向长短期记忆网络进行混合得到一种混合神经网络,该网络利用CNN来获取向量化之后的文本的局部特征,同时融合词性特征和预训练词向量特征,一起作为Bi_LSTM的输入,进一步学习融合了多种信息的文本语义特征,最后使用CRF做约束,抽取出最终的方面项。该模型在CoNLL-2003数据集上的准确率和F1值相较于其他基准模型都有所提升,证明了本模型的有效性。 (2)提出一种基于Roberta和注意力机制的方面级情感分析模型,来获取文本中不同方面项的情感极性,模型通过Roberta预训练语言模型来表示文本词向量,然后利用多头注意力机制获取上下文文本中每个词的相互依赖关系,学习到了更深层次语义特征,同时利用Bi_GRU提取方面项的语义信息,为了能够充分学习上下文文本和方面项的依赖关系,使用交互注意力机制来增强两者的影响。最后与现有模型作对比,证明本文所提模型的优越性。