摘要
随着社交网络与电子商务的迅速发展,大量的商品评论文本呈井喷式出现。对这些评论文本使用情感分析技术进行挖掘,通过分析消费者对于所购买产品的评论文本可以了解产品的优劣并对潜在的消费者起到一定的参考作用。然而传统的深度学习方法存在词向量特征输入单一,无法区分同义词以及忽略特征项的位置信息和频次信息等问题。针对这些问题,本文提出了基于多特征融合和注意力机制情感分类模型。以情感分类问题常用的模型CNN-BiLSTM作为基准,并对基准模型进行改进使其在情感分类任务中发挥更高性能。本论文主要的研究内容包括以下几个方面: (1)提出融合情感特征的卷积双向长短期记忆网络情感分类模型(SF-CNN-BiLSTM)解决同词不同义问题。本文在CNN-BiLSTM情感分类模型问题的基础之上进行了研究,并提出改进意见,构建了融合情感特征的情感分类(SF-CNN-BiLSTM)网络模型,该模型将词语、词性、词语情感特征向量化后拼接作为模型的输入层,扩充词向量所含的信息量,利用多特征融合解决同词不同义问题以及表达多情感特征信息。然后采用Chunk-MaxPooling的方法代替最大池化方法,考虑转折句前后对情感倾向性判断,综合句法结构位置特征,改进传统神经网络模型结构。实验结果显示,SF-CNN-BiLSTM模型相对于其他传统网络模型在文本情感分类上效果更好。 (2)提出基于注意力机制和多特征融合的情感分类模型(SF-CNN-BiLSTM-ATT)解决上下文冗余信息对文本情感分类的影响。通过将注意力机制加入神经网络的训练,生成特征向量的加权语义表示,增强当前关键字与其有关上下文信息的联系,注重在情感分类任务上关注具有重要影响的关键字,可以更准确地分析文本情感倾向。相比SF-CNN-BiLSTM模型,SF-CNN-BiLSTM-ATT模型的准确率、召回率和F1值均有所提高。 实验结果表明,本文提出的SF-CNN-BiLSTM-ATT模型能有效的提高情感分类的准确性。本文创新的采用多特征词向量作为输入层来丰富模型输入语义特征,使用分段池化考虑转折句前后对情感倾向性的判断,最后考虑文本数据中每个词汇的影响程度不同来引入注意力机制,利用注意力机制增强关键字的权重,从而提高模型分类的准确率。