首页|一种主动学习和协同训练相结合的半监督微博情感分类方法

一种主动学习和协同训练相结合的半监督微博情感分类方法

扫码查看
[目的]针对微博情感分类时未标注样本多和已标注集少的问题,提出一种新的方法.[方法]在协同训练算法的基础上引入主动学习思想,从低置信度样本中选取最有价值的、信息含量大的,提交标注,标注完后添加到训练集中,重新训练分类器进行情感分类.[结果]使用不同的数据集进行实验,实验结果表明该方法所构建的分类器性能优于其他方法,分类准确率明显提高.特别是在已标注样本占40%的情况下,提升5%左右.[局限]在协同训练过程中使用随机特征子空间生成方法不能保证每次构建的两个分类器都是强分类器,因此未能充分地满足协同训练的假设条件.[结论]引入主动学习思想后,能够解决协同训练对低置信度样本处理的不足,进而增强分类器性能,提高分类准确率.
Semi-supervised Micro-blog Sentiment Classification Method Combining Active Learning and Co-training

毕秋敏、李明、曾志勇

展开 >

昆明理工大学艺术与传媒学院 昆明650093

云南财经大学信息学院 昆明650221

云南财经大学信息管理中心 昆明650221

协同训练 主动学习 情感分类

云南省哲学社会科学规划基金

QN2014071

2015

数据分析与知识发现
中国科学院文献情报中心

数据分析与知识发现

CSTPCDCSSCICHSSCD
影响因子:1.452
ISSN:2096-3467
年,卷(期):2015.(1)
  • 4
  • 4