摘要
随着电子商务市场的不断扩大,网络购物已经成为一种蓬勃发展的趋势。消费者在电子商务平台所留下的评论信息,对于其他消费者了解商品以及商家根据消费者反馈信息确定后续决策等都具有重要的参考价值。然而,由于评论数量庞大,商家往往难以有效地处理和分析这些评论数据。本文以京东商城获取的小米手机评论数据为样本,针对现有的深度学习方法中模型输入向量包含语义信息有限且对方面词感知较弱的问题,研究内容如下: (1)提出了词嵌入的方面抽取模型。该模型利用融合拼音和字形的ChineseBERT训练词向量,结合双向长短期记忆网络学习上下文特征,然后通过条件随机场学习相邻标签之间的依赖关系,实现对方面词的抽取。 (2)为解决传统的BiLSTM等深度学习模型没有考虑词语的位置信息以及计算效率问题,使用Transformer模型替代传统的深度学习模型,提出了一种使用Complex-order位置编码和内存压缩注意力机制改进Transformer的模型。模型通过位置编码,能够捕获评论文本中词语的绝对位置和相对位置信息。同时使用内存压缩的注意力机制替代多头注意力机制。引入双向注意力流学习评论文本和方面文本的关系。最后采用多层感知机分类输出评论文本中不同方面的情感极性。准确率和F1值分别为83.52%和83.98%。 (3)为了进一步挖掘评论中隐藏的主题信息,根据本文提出的商品评论情感分析得到的结果,使用ChineseBERT进行词向量的转化,并采用余弦相似度提取语句输入到LDA模型,获得主题词及其相关评价词,相较于传统的LDA模型提高了商品评论文本主题提取的精确度。 实验结果表明,本文所提出的情感分析模型在获得的手机数据集上相比于改进前的模型在情感分类准确率和F1值分别提升了1.86%和1.06%,提出的改进LDA模型相比传统的LDA模型有着更好的效果。因此,本研究具有重要的理论意义和实践意义,为平台处理电子产品评论数据提供有效的参考依据。