一种主动学习和协同训练相结合的半监督微博情感分类方法

扫码查看

原文链接

NETL
NSTL
万方数据
维普

中文摘要：[目的]针对微博情感分类时未标注样本多和已标注集少的问题,提出一种新的方法.[方法]在协同训练算法的基础上引入主动学习思想,从低置信度样本中选取最有价值的、信息含量大的,提交标注,标注完后添加到训练集中,重新训练分类器进行情感分类.[结果]使用不同的数据集进行实验,实验结果表明该方法所构建的分类器性能优于其他方法,分类准确率明显提高.特别是在已标注样本占40％的情况下,提升5％左右.[局限]在协同训练过程中使用随机特征子空间生成方法不能保证每次构建的两个分类器都是强分类器,因此未能充分地满足协同训练的假设条件.[结论]引入主动学习思想后,能够解决协同训练对低置信度样本处理的不足,进而增强分类器性能,提高分类准确率.

外文标题：Semi-supervised Micro-blog Sentiment Classification Method Combining Active Learning and Co-training

作者：

毕秋敏、李明、曾志勇

展开 >

作者单位：

昆明理工大学艺术与传媒学院昆明650093

云南财经大学信息学院昆明650221

云南财经大学信息管理中心昆明650221

关键词：

协同训练主动学习情感分类

基金：

云南省哲学社会科学规划基金

项目编号：

QN2014071

出版年：

2015

数据分析与知识发现

中国科学院文献情报中心

数据分析与知识发现

CSTPCDCSSCICHSSCD

影响因子：1.452

ISSN：2096-3467

年,卷(期)：2015.(1)

被引量4
参考文献量4