现代计算机2022,Vol.28Issue(18) :16-22.DOI:10.3969/j.issn.1007-1423.2022.18.003

基于LDA—加权Word2Vec组合的机器学习情感分类模型研究

Research on Emotion Classification Based on Topic Model and Word Vector Combination Feature

陈登建 杜飞霞 吴瑞雪 杨秀璋 夏换
现代计算机2022,Vol.28Issue(18) :16-22.DOI:10.3969/j.issn.1007-1423.2022.18.003

基于LDA—加权Word2Vec组合的机器学习情感分类模型研究

Research on Emotion Classification Based on Topic Model and Word Vector Combination Feature

陈登建 1杜飞霞 1吴瑞雪 1杨秀璋 1夏换2
扫码查看

作者信息

  • 1. 贵州财经大学信息学院,贵阳 550025
  • 2. 贵州财经大学贵州省经济系统仿真重点实验室,贵阳 550025
  • 折叠

摘要

为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征(LDA-Word2Vec)的情感分类模型.通过LDA主题模型对长评论文本进行特征提取,构建所有主题下的特征词库;借助特征词库构建长评论的LDA特征表达;利用CBOW训练得到特征表达后文本的词向量表示,使用TF-IDF对词向量进行加权并融合语义特征,再构建机器学习模型对长评论文本进行情感分类的方法,研究了机器学习情感分类模型.实验结果表明:相较于传统的文本特征表示方法,本文提出的LDA-Word2Vec组合特征的方法,在情感分类的准确率与召回率的表现上都更加优秀.可见本文的模型能够进一步挖掘文本的情感特征,具有一定学术意义和现实意义.

关键词

LDA主题挖掘/Word2Vec模型/机器学习/情感分类

引用本文复制引用

出版年

2022
现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
参考文献量17
段落导航相关论文