首页|基于多任务学习的文本情感分析算法研究

基于多任务学习的文本情感分析算法研究

扫码查看
伴随着互联网技术的发展和5G技术的出现,越来越多的用户可以在网络上发表看法和言论。掌握用户评论的情感倾向是把握用户需求不可缺少的关键点,文本情感分析就是对文本数据进行有效挖掘分析的技术。传统的文本情感分析针对的一般是句子的整体情感倾向,而伴随着文本信息的增多和用户需求的提升,情感分析需要准确识别出文本信息中包含的不同情感目标,并根据不同方面进行情感极性的判断。基于目标方面的情感分析(TABSA)旨在识别与给定目标相关的特定方面的细粒度情感极性,是情感分析的子任务,本文在对TABSA技术深入研究后,发现该技术在现阶段存在以下两个问题。 首先,由于情感目标与情感极性方面的多样性,即便在情感密度较低的文本数据中,现有的TABSA技术仍对目标和方面的定义存在歧义,这可能导致在训练过程中模型对目标和方面之间的关联性识别出现偏差,使得判断情感单词与上下文的关系有误,降低文本情感分析的准确性;其次,当前的文本信息往往包含多种情感,而且语法结构越来越复杂,各种新颖的语言描述和模糊的情感词语不断出现,导致现有的技术和方法难以精确识别出高情感密度的文本情感倾向。 针对以上提到的问题,本文进行了以下几个方面的研究。 第一,根据文本数据信息中包含的情感目标和方面之间的关系,设计不同类型辅助句子,将TABSA任务转换成句子对分类任务,通过预训练模型BERT进行训练。本文提出的辅助句设计有助于解决模型训练过程中,识别情感目标与情感极性方面之间的关联性偏差问题,加强模型对目标与方面的特征学习能力,提高文本情感分析的准确性;第二,本文利用多任务学习的思想解决句子中包含的多种情感识别困难问题,将句子对任务与多任务学习思想结合,提出基于多任务学习的辅助句任务模型MTL-AS,通过学习不同任务的有效特征,提升包含多种情感的文本信息在情感分析任务上的准确性。 综合以上工作,本文通过两个情感密度不同的数据集进行实验验,实验表明:在语法结构简单且情感密度低的情况下,通过设计辅助句将TABSA任务转换成句子对任务训练模型,能够有效的提升文本情感分析任务的准确性,平均准确率和AUC分数均有所提升,准确率最高提升了7.5%,AUC分数最高提升了3.9,证明辅助句设计的可行性;在情感密度较高的训练数据集中,MTL-AS模型在文本情感分析上要比单句子对任务的效果更出色,并且能够获得比较好的模型性能,准确率最高提升了3.9%,验证了辅助句子对任务结合多任务学习模型的有效性。

廖泽宇

展开 >

文本情感分析 辅助句 预训练模型 多任务学习

硕士

电子信息

肖明、曹永军

2023

广东工业大学

中文

TP