首页|基于LDA—加权Word2Vec组合的机器学习情感分类模型研究

基于LDA—加权Word2Vec组合的机器学习情感分类模型研究

扫码查看
为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征(LDA-Word2Vec)的情感分类模型.通过LDA主题模型对长评论文本进行特征提取,构建所有主题下的特征词库;借助特征词库构建长评论的LDA特征表达;利用CBOW训练得到特征表达后文本的词向量表示,使用TF-IDF对词向量进行加权并融合语义特征,再构建机器学习模型对长评论文本进行情感分类的方法,研究了机器学习情感分类模型.实验结果表明:相较于传统的文本特征表示方法,本文提出的LDA-Word2Vec组合特征的方法,在情感分类的准确率与召回率的表现上都更加优秀.可见本文的模型能够进一步挖掘文本的情感特征,具有一定学术意义和现实意义.
Research on Emotion Classification Based on Topic Model and Word Vector Combination Feature

陈登建、杜飞霞、吴瑞雪、杨秀璋、夏换

展开 >

贵州财经大学信息学院,贵阳 550025

贵州财经大学贵州省经济系统仿真重点实验室,贵阳 550025

LDA主题挖掘 Word2Vec模型 机器学习 情感分类

2022

现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
年,卷(期):2022.28(18)
  • 17