摘要
近年来,随着社交媒体和电商平台的快速发展,每天都会产生大量的评论,并且这些评论具有丰富的情感信息。如果能够基于这些评论文本,挖掘用户的情感倾向,无论对平台还是用户,都具有重要作用。文本情感分析领域,主要分为篇章级、句子级和方面级。针对评论文本特点,更加适用于方面级情感分析。因此,论文主要研究对评论中方面词的抽取和对给定方面词情感极性的判别。 论文的主要工作内容如下: (1)在方面级情感分析领域中,首先需要对评论中的方面词进行识别。因此,论文基于BERT-BiLSTM-CRF模型,实现对评论文本中方面词的抽取。针对方面识别任务,该模型采用BERT进行语义编码表示,并利用BiLSTM学习上下文信息特征,然后通过CRF层学习相邻标签之间的依赖关系,获取最佳标注序列,实现对方面词的抽取。同时,设计该模型的消融实验,结果证明通过BERT作语义表示,BiLSTM学习上下文特征的有效性。最终,将该模型同基线模型在相关数据集上进行实验比较,结果证明基于BERT-BiLSTM-CRF模型在方面识别任务中的有效性。 (2)论文提出一种融合辅助信息的BiAtt-GCN模型(AI-BiAtt-GCN),对给定方面词作出情感极性判别。首先,该模型在方面表示特征中,融入具有词性信息的上下文特征以及位置编码信息特征,并通过注意力机制计算出新的方面特征向量,其次利用方面词在评论中的相对位置,构造出方面特征的图结构,以此作为图卷积神经网络的输入,最终对方面词作出情感极性判别。然后,将论文模型同基线模型在多个数据集上进行实验比较,结果证明该方法能够有效地处理方面情感分析任务。最后,设计该模型的消融实验,结果表明词性信息、位置编码信息以及图卷积神经网络对方面情感分析具有重要作用。 (3)论文根据已实现的方面识别模型和方面情感分析模型,借助常用的Web开发框架,完成方面级用户评论情感分析原型系统的开发与实现,并详细阐述系统需求、系统架构以及核心功能模块的设计与实现。最终,对相关页面进行展示,验证该系统的可用性。