首页|基于RoBERTa模型的小红书文本情感分析研究

基于RoBERTa模型的小红书文本情感分析研究

杨斌强

基于RoBERTa模型的小红书文本情感分析研究

杨斌强1
扫码查看

作者信息

  • 1. 南昌大学
  • 折叠

摘要

小红书是目前我国最受欢迎的社交电商平台之一,用户可以在该平台上发布自己的购物心得和产品使用体验,随着用户数量的不断增长,平台上的文本数据也在快速增长。因此,针对小红书的笔记文本,本文利用自然语言处理技术深入挖掘其中正面和负面的情感表达,不仅能够让商家了解消费者对产品和服务的态度,同时也可以为消费者提供参考,具有一定的理论和现实研究意义。 传统的情感分析方法在面对小红书文本表达口语化程度高、语法不规范和网络用语层出不穷的情况下,对语义特征的提取表现较差。本文在传统的情感分析方法上进行改进,提出了针对小红书文本的情感分析模型,主要工作如下: (1)构建了小红书文本数据集。通过爬虫技术获取用户发布的笔记文本,再进行文本清洗和人工标注情感标签后,最终构建了包含 10747 条文本的数据集。 (2)针对小红书文本表达不规范,语义特征提取困难的问题,提出了基于RoBERTa-BiLSTM-Attention的情感分析模型。该模型引入基于BERT改进的RoBERTa 来获取文本的向量化表示,解决传统 Word2vec 不能表示一词多义的问题,利用改进网络BiLSTM弥补LSTM无法利用下文信息的不足,同时与注意力机制融合,突出文本中的重要情感信息,实验结果表明该模型与其他基准模型相比分类性能更好。 (3)针对目前常用的预训练模型加微调的情感分析方法存在上下游训练目标不一致,导致不能充分发挥预训练模型自身能力的问题,提出了基于RoBERTa 融合关键词抽取与提示学习的情感分析模型,该模型将抽取到的关键词融入输入文本中增加文本的上下文信息,使模型更好地理解文本的情感,通过设计提示模板,利用提示学习提高下游任务对预训练语言模型中知识的利用,实验结果表明该模型具有更好的情感分析效果。 (4)以提出的模型为基础,设计并实现小红书文本情感分析原型系统,该系统主要包括用户管理模块、数据处理模块和情感分析与结果展示模块。

关键词

社交平台/笔记文本/情感分析/RoBERTa模型/关键词抽取/提示学习

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

郑超美/黄晓川

学位年度

2023

学位授予单位

南昌大学

语种

中文

中图分类号

TP
段落导航相关论文