现代计算机2022,Vol.28Issue(2) :29-36.DOI:10.3969/j.issn.1007-1423.2022.02.004

基于改进LDA-CNN-BiLSTM模型的社交媒体情感分析研究

Research on Social Media Sentiment Analysis Based on Improved LDA-CNN-BiLSTM Model

杨秀璋 刘建义 任天舒 宋籍文 武帅 姜婧怡 陈登建 周既松 李娜
现代计算机2022,Vol.28Issue(2) :29-36.DOI:10.3969/j.issn.1007-1423.2022.02.004

基于改进LDA-CNN-BiLSTM模型的社交媒体情感分析研究

Research on Social Media Sentiment Analysis Based on Improved LDA-CNN-BiLSTM Model

杨秀璋 1刘建义 1任天舒 1宋籍文 2武帅 3姜婧怡 1陈登建 1周既松 1李娜4
扫码查看

作者信息

  • 1. 贵州财经大学信息学院,贵阳 550025
  • 2. 贵州高速公路集团有限公司,贵阳 550027
  • 3. 贵州财经大学信息学院,贵阳 550025;涟水县财政局,淮安 223400
  • 4. 中国船舶工业系统工程研究院,北京 100094
  • 折叠

摘要

针对社交媒体情感分析忽略情感特征的长距离语义关系,无法精确捕获带有情感色彩的特征词,过度依赖人工标注等问题,本文提出一种改进LDA-CNN-BiLSTM模型,旨在实现对微博舆情事件的情感分析研究.首先,通过对微博舆情事件评论文本进行数据采集和数据预处理,获取"喜悦""愤怒"和"哀伤"三种类别情感文本.其次,构建融合LDA模型、情感词典和人工标注的算法并用于情感特征词提取,使用Word2Vec将经过特征提取后的情感文本转换为词向量.最后,构建CNN-BiLSTM模型,利用卷积神经网络提取文本的关键特征,长短时记忆网络捕获长距离语义特征,从而完成情感分类任务.实验结果表明,本文方法的精确率、召回率、F1值和准确率分别为0.8946、0.8841、0.8893和0.8778,整体实验结果均优于现有的机器学习和深度学习模型,并且融合LDA模型和情感词典的实验结果均有明显提升,其F1值比实验中的六种机器学习模型平均提升3.66%,比七种深度学习模型平均提升1.84%.综上,本文方法能够应用于社交媒体的情感分析任务,并有效感知舆情事件的情感态势,具有一定的研究价值.

关键词

情感分析/社交媒体/LDA模型/CNN-BiLSTM/文本挖掘

引用本文复制引用

基金项目

国家自然科学基金(62062019)

贵州省科技计划(黔科合基础[2019]1041)

贵州省科技计划(黔科合基础[2020]1Y279)

贵州省教育厅青年科技人才成长项目(黔教合KY字[2021]135)

贵州财经大学校级项目(2019)(2019XQN01)

出版年

2022
现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
被引量4
参考文献量17
段落导航相关论文