陕西师范大学学报(自然科学版)2020,Vol.48Issue(2) :9-16.

基于主动学习的标签噪声清洗方法

A method of label noise cleaning based on active learning

孟晓超 姜高霞 王文剑
陕西师范大学学报(自然科学版)2020,Vol.48Issue(2) :9-16.

基于主动学习的标签噪声清洗方法

A method of label noise cleaning based on active learning

孟晓超 1姜高霞 1王文剑2
扫码查看

作者信息

  • 1. 山西大学 计算机与信息技术学院,山西 太原 030006
  • 2. 计算机智能与中文信息处理教育部重点实验室(山西大学),山西 太原 030006
  • 折叠

摘要

在监督分类学习中,标签噪声对模型有重要的影响;而现有的标签噪声过滤方法一般都是基于模型的预测结果对噪声样本进行检测并去除,当噪声样本较多时,去除噪声样本的同时将会影响原来样本的完整性,使样本信息缺失.针对这一问题,提出一种基于主动学习的标签噪声清洗方法(active label noise cleaning based on classification with gaussian process,GP_ALNC),该方法将高斯过程模型和主动学习相结合,从已有标签样本集中筛选出不确定性最高的样本交给人工专家进行检验,通过这种迭代方法清洗掉大部分噪声数据的同时保持了原有数据的完整性;并针对二分类任务中的标签噪声问题,在MNIST数据集和UCI数据集上,与已有方法ALNR(active label noise removal)以及ICCN_SMO(iterative correction of class noise based on SMO)进行了实验对比,并取得了不错的表现.

关键词

标签噪声/噪声清洗/高斯过程/主动学习

引用本文复制引用

基金项目

国家自然科学基金(U1805263)

山西省回国留学人员科研基金(2016004)

出版年

2020
陕西师范大学学报(自然科学版)
陕西师范大学

陕西师范大学学报(自然科学版)

CSTPCDCSCD北大核心
影响因子:0.563
ISSN:1672-4291
被引量4
参考文献量1
段落导航相关论文