首页|微博文本主题词与情感分析——以“上海迪士尼”相关事件为例

微博文本主题词与情感分析——以“上海迪士尼”相关事件为例

李明蔚

微博文本主题词与情感分析——以“上海迪士尼”相关事件为例

李明蔚1
扫码查看

作者信息

  • 1. 山东科技大学
  • 折叠

摘要

随着信息技术的迅速发展,微博等社交网络平台也发展迅速,给人们跨时空的交流与沟通提供了渠道。网络社交产生了大量的信息,网民既是信息的生产方、传播者,又是信息的接受者。微博评论区对于社会热点事件的评价与讨论呈现指数级增长。如何正确分析与合理利用网民对热点事件的态度和情感倾向,是目前网络舆情研究的热点。企业也可以了解到其自身和企业的产品在网民中的口碑,制定相对应的策略方案,这对企业发展具有重要的意义和实用价值。 本文以新浪微博文本为研究内容,进行了微博文本的主题词提取与微博评论的情感分析,并以“上海迪士尼”相关事件为例,探讨微博主题与评论的情感倾向。首先,介绍了网络爬虫、文本表示与分类方法、LDA模型以及基于情感词典和深度学习的情感分析方法,详细描述了情感倾向模型,其中包括情感文本抽取、情感分类工作以及情感强度计算和倾向判断三个部分。其次,本文使用网络爬虫的方式获取文本,以“上海迪士尼”相关事件为切入点,选择新浪微博博文、评论数据作为文本分析的数据源,并对所获取的数据集预处理,如去重、去停用词、利用HowNet情感分析词典对文本情感分词等工作,再将预处理后的数据集进行多元情感标注。再次,本文依据困惑值拐点位置来确定主题词数目,使用LDA模型得到K个的主题词,并概括出每个事件用户评论的两个热点主题;使用改进算法TF-IDF-COS和SVM模型得到相关与主观文本抽取结果,再将其输入至SVM-BiLSTM改进算法中得到情感分类文本集,从而依据公式可以计算出每个事件的情感强度值,判断该事件为消极还是积极事件。 通过对热点事件的微博主题内容和评论的情感分类、情感倾向分析,阐述上海迪士尼企业在中国发展过程中所存在的问题,并针对其存在的问题提出解决方案,供企业参考。

关键词

微博文本/主题词/情感分析

引用本文复制引用

授予学位

硕士

学科专业

图书情报

导师

徐建国

学位年度

2020

学位授予单位

山东科技大学

语种

中文

中图分类号

G3
段落导航相关论文