基于弹幕文本的情感极性分析与用户分类应用

杜林君¹

扫码查看

作者信息

1. 东华大学
折叠

摘要

随着信息技术的不断发展，弹幕这一视频评论模式在各大视频网站逐渐兴起，受到了广大群众的喜好。区别于传统评论形式，弹幕能够使视频用户在观看的同时发布对当前内容的评论，具有即时性的特点，因而能够更加准确地反映出用户在观看视频时的观点和情感。然而目前对于弹幕的研究大多基于传播学、用户心理等角度，对弹幕文本进行情感分析方面的研究较少。本学位论文旨在利用自然语言处理相关技术对弹幕文本的情感极性作研究，并基于实际场景进行一定的应用分析。具体研究内容如下：首先，使用网络爬虫方式获取了Bilibili网站中指定视频的弹幕数据，并基于弹幕文本非正式化、复杂性的特点进行了一系列数据预处理，使用预训练word2vec词向量模型完成了对文本数据的特征提取。其次，分别基于传统机器学习和深度学习神经网络建立了弹幕文本情感极性分类模型，经过比较分析得到，双向LSTM模型相较于其他模型在各项评价标准上综合表现最优，在该情感分类问题中具有优势。最后，选择《后疫情时代》视频中的弹幕用户作为研究对象，通过应用情感分析模型得到了用户的弹幕情感分布时间序列，基于对噪声弹幕的研究对用户进行了筛选，选取了情感分布的最优时间间隔，并使用基于DTW算法的K-means聚类方法对视频用户群体建立了分类标签，通过分析验证得到了该方法的有效性。参考本学位论文分析得到的研究结论，可以使视频内容创作者了解观众观看视频时的情感变化趋势、视频热点内容和受众群体分类，为其提供了视频内容调整方向。对于视频网站而言，则为其提供了新的弹幕视频用户分类标签准则，为进行更精准的视频推荐作补充依据。对广告投资企业而言，可以了解到不同视频对弹幕用户的情绪调动能力，为其提供决策支持。总体而言，可以促进优质视频内容的产出和接收，营造更佳的视频内容社区氛围。

关键词

视频弹幕/情感分析/长短期记忆网络/用户分类/K-均值聚类算法

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

闫理坦/陆允生

学位年度

2022

学位授予单位

东华大学

语种

中文

中图分类号

段落导航