首页|基于方面级的文本情感分类研究

基于方面级的文本情感分类研究

邵思宇

基于方面级的文本情感分类研究

邵思宇1
扫码查看

作者信息

  • 1. 重庆大学
  • 折叠

摘要

近年来,由于互联网以及社交媒体的不断发展,网络上的文本数据呈爆发式增长。研究这些文本数据的情感倾向对于政府部门的舆情监控、企业的产品调研以及商家的商品推荐具有重要意义。早期的文本情感分类方法大多是基于句子级甚至整个篇章级的,这对于需要细粒度分析文本的场景显然是不够的,由此产生了基于方面级的文本情感分类。 然而目前绝大多数基于方面级的情感分类方法研究对象均为aspect-term,无法实现对更抽象和更高层方面的情感分析,且这些方法对数据集均有着严格的要求,需要同时标注文本所包含的方面以及该方面在文本中的具体位置,这极大地限制了方面级情感分类的使用场景。针对上述问题,本文提出了一种基于方面级的文本情感分类系统,该系统以aspect-category为研究对象,对数据要求非常宽松,仅需提供文本内容及文本可能包含的方面集合便可得到文本在每个实际包含方面下的情感倾向。本文所做具体工作如下: ①详细介绍了自然语言处理问题中的ABSA(Aspect Based Sentiment Analysis)任务原理以及目前解决文本情感分类的主流方法,具体包括基于情感词典的方法、基于机器学习的方法和基于深度学习的方法,为后续工作奠定了基础。 ②抽取和识别文本中所包含的方面。该问题可建模为一个多标签分类任务,为了解决该任务本文基于深度学习方法提出了一种基于标签参数的LP-LSTM(Label Parameter based LSTM)模型,通过与CNN、标准RNN和LSTM三种模型进行实验对比,验证了引入标签参数后可以有效提升多标签分类任务的准确率,实验结果最终在数据集上的查准率达到了0.938,查全率达到了0.936,??值达到了0.937。 ③面向方面的情感分类。对于已经抽取和识别出的方面,需要针对每个方面分析其情感倾向,本文通过在LSTM网络的基础上引入注意力机制最终实现对于一句文本中所包含的一个或多个方面上的情感预测。通过与LSTM、Bi-LSTM、Bi-LSTM+方面嵌入三种模型进行对比,验证了引入注意力机制后可以有效地利用方面与上下文之间的关系,提高情感分类的准确率,模型最终在数据集上的准确率达到了79.8%,宏F1值达到了0.838。

关键词

文本情感分类/方面级别/多标签分类/长短期记忆网络/注意力机制

引用本文复制引用

授予学位

硕士

学科专业

工程(计算机技术)

导师

古平

学位年度

2020

学位授予单位

重庆大学

语种

中文

中图分类号

TP
段落导航相关论文