首页|面向社交媒体文本的情感分析方法研究

面向社交媒体文本的情感分析方法研究

仪佳

面向社交媒体文本的情感分析方法研究

仪佳1
扫码查看

作者信息

  • 1. 齐鲁工业大学
  • 折叠

摘要

随着网络技术的发展,社交媒体平台不断进入人们的视野,越来越多的人们参与社交媒体平台上对于服务、话题、事件等实体对象的讨论。这些讨论大多数的存储方式是文本形式,大量的文本数据在社交媒体上产生,相关的研究人员可以通过对这些讨论文本进行分析得到公众热议的话题、对某些服务的评价等信息。无论是对于消费者、企业还是政府任何一方而言,社交媒体文本的情感分析都具有十分重要的现实意义。传统的情感分析只能对整体文本的情感进行分类,无法捕捉到具体细节方面的情感,与之不同的是,基于方面的情感分析(Aspect-Based Sentiment Analysis,ABSA)的方法可以对文本中的具体方面或实体进行细粒度情感分析。这提供了更准确的情感分析,使人们能够更好地理解用户对不同方面的态度和情感。ABSA任务因为其细粒度的情感分析得到了越来越多研究者的关注,所以本文重点研究基于方面的情感分析。 目前的研究存在以下问题:(1)大多数研究通过依赖分析将图中所有词之间的关系等同对待,而忽略了这些关系的具体依赖类型。这种做法可能会导致模型无法区分重要的关联关系,并且也缺乏有效的机制识别和学习这些重要关系以及基于图的模型的不同层次的信息。(2)由于一些特定的数据集包含非正式表达式和一些复杂的在线评论,没有明显的语法结构,这导致图卷积网络(Graph Convolutional Network,GCN)不能有效地预测这些数据集上方面项的极性。此外,依赖树可能包含噪声和不准确性。为解决以上问题,本文对现有方法进行改进,做出了以下贡献: (1)本文提出了一种基于依赖类型和成分树的方面级情感分析模型(Collaborative Computation Model Based on Dependency Types and Constituent Trees,CDTC)用于方面的情感分析。具体而言,依赖类型图卷积网络和句法编码器的协同计算增强了任务效率。首先,本文引入了一个依赖类型图卷积网络模块,通过将单词关系和依赖类型结合起来全面学习依赖解析结果,以增强ABSA。然后,本文使用注意力层将从不同GCN层学到的上下文信息进行整合和结合。其次,本文提出了一个句法编码器模块,通过引入成分树结构来扩展传统的基于依赖关系的方法。成分树通常包括精确的短语分割和层次组合结构,有助于正确地对齐方面情感的表示和相应的单词。利用依赖类型有助于区分重要关系,而成分树的短语分割和层次结构提供了更丰富的句法信息。在三个数据集上进行的广泛实验表明,本文提出的CDTC模型与基线模型相比均提升了约1个百分点。 (2)本文提出了一种基于上下文引导和句法增强的双图卷积网络(Context-guided and Syntactic Augmented Dual Graph Convolutional Network,CSADGCN)模型用于ABSA任务。具体而言,本文提出了一种上下文引导的注意机制,通过结合自注意力和方面级别注意力捕捉全局和局部信息,即使一些句子没有明显的句法结构。此外,本文使用多种语言特征增强GCN,并利用双仿射注意模块捕捉单词之间的关系。在三个数据集上进行的广泛实验表明,与最新的基准方法相比,本文提出的CSADGCN模型具有更优越的性能,在六个指标上均得到3至6个百分点的提升。

关键词

社交媒体/方面级情感分析/双图卷积网络/注意机制

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

刘祥志

学位年度

2024

学位授予单位

齐鲁工业大学

语种

中文

中图分类号

TP
段落导航相关论文