首页|商品评论情感分析技术研究

商品评论情感分析技术研究

张佳悦

商品评论情感分析技术研究

张佳悦1
扫码查看

作者信息

  • 1. 北京交通大学
  • 折叠

摘要

互联网2.0时代,每天在网络上都会产生大量的主观性文本,这些文本其实具有极其深远的价值。其中最具代表性的有社交网络、各种论坛及会产生评论数据的各类网站,这些地方汇聚着网民们真实的想法,而非新闻一类客观的描述。将这些海量的内容进行深度挖掘工作,可以带来意想不到的成果。本文选择商品评论进行情感分析,使人们可以快速简单地了解商品的主要优缺点,根据自己的关注点做出相应的判断以及针对性地改进。 本文使用Scrapy框架在京东商城中抓取了小米mix2手机的评论文本作为实验的源数据。经过数据清洗、中文分词、去停用词、文本向量化以及建立字典的过程,对评论文本进行预处理,最终生成了可以直接输入到神经网络中的数据。其中建立字典的过程包括给文本建立索引标号、序列补齐或截断以及转换为矩阵三个步骤。 对于狭义的情感分析分类工作,本文采用大量预处理工作,提前使用Word2Vec浅层神经网络模型将文本向量化。然后将已经向量化的模型输入到LSTM深度学习模型第一层网络层的嵌入层中,再次进行训练后判断评论文本的褒贬义。将Word2Vec模型产生的词向量模型输入到LSTM模型的嵌入层,相当于进行了两次向量化过程,这种方法有效地将文本分类的准确率提高至89.6%。 整体的评论文本挖掘工作,本文采用K-means聚类短评论,辅助词频统计、Word2Vec关键词相关词提取及人工概括等手段,形成8个展示标签。均为“名词+形容词”形式,后接该方面被提及的所有次数。标签中红色表示褒义,绿色为贬义,点击可以查看到相应的所有评论文本,其中对应的短评论标红显示。 本文有效地提高了中文文本情感分析的准确率,并构建商品评论情感分析系统,直观地展示了商品的优缺点,加快了人们对于文本的理解速度,免除阅读海量文本的辛苦。消费者可以快速做出购买决策,商家可以针对最为人诟病的地方做出改进,提高销量,可以产生直接的经济价值。

关键词

商品评论/情感分析/文本挖掘/标签技术

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

李向前

学位年度

2018

学位授予单位

北京交通大学

语种

中文

中图分类号

TP
段落导航相关论文