融合内容特征与传播特征的微博文本情感分类

Micro-blog text emotion classification based on the fusion of content features and spread features

陈红阳 ¹黄正洪 ¹何盈盈 ¹周也力²

扫码查看

作者信息

1. 重庆人文科技学院计算机工程学院,重庆 401524
2. 成都理工大学信息科学与技术学院,成都 610059
折叠

摘要

基于Word2vec的文本向量化表示方法未充分考虑微博文本的内容特征与传播特征,导致文本向量化表示欠佳,且采用单个机器学习算法进行情感分类的精度不高.提出一种融合文本中表情符号,词的语义、词性与情感等内容特征,评论、转发与点赞数等传播特征,共同构建蕴含丰富语义与情感信息的文本特征向量.根据各基分类器在训练数据集上的性能表现设置不同权重,并与类概率向量相乘,保留最大、最小与平均加权概率值,同时结合原始文本特征向量作为元分类器的输入数据以改进原Stacking算法,进行微博文本情感分类.在微博数据集上的实验结果表明:本文方法能更好地表示文本向量,以加权方式改进的Stacking 集成学习分类器优于单个分类器;相较于其他情感分类方法,本文方法的准确率提升1.75%～4.90%.

关键词

微博文本/情感特征/词性特征/传播特征/情感分类

Key words

micro-blog text/emotion feature/part of speech feature/spread feature/emotion classi-fication

引用本文复制引用

基金项目

重庆市教委科学技术研究计划(KJQN201901801)

重庆市教委科学技术研究计划(KJQN202001803)

重庆市教委科学技术研究计划(KJQN202303114)

重庆市教委科学技术研究重点项目(KJZD-202001801)

重庆人文科技学院校级技术创新专项(2020)(CQRKZK2020004)

出版年

2023

重庆理工大学学报

重庆理工大学

重庆理工大学学报

CSTPCD北大核心

影响因子：0.567

ISSN：1674-8425

被引量1

参考文献量13

段落导航