计算机研究与发展2022,Vol.59Issue(12) :2844-2857.DOI:10.7544/issn1000-1239.20210471

面向概念漂移且不平衡数据流的G-mean加权分类方法

G-mean Weighted Classification Method for Imbalanced Data Stream with Concept Drift

梁斌 李光辉 代成龙
计算机研究与发展2022,Vol.59Issue(12) :2844-2857.DOI:10.7544/issn1000-1239.20210471

面向概念漂移且不平衡数据流的G-mean加权分类方法

G-mean Weighted Classification Method for Imbalanced Data Stream with Concept Drift

梁斌 1李光辉 1代成龙1
扫码查看

作者信息

  • 1. 江南大学人工智能与计算机学院,江苏无锡 214122
  • 折叠

摘要

数据流中的概念漂移和类别不平衡问题会严重影响数据流分类算法的性能和稳定性.针对二分类数据流中概念漂移和类别不平衡的问题,在基于数据块的集成分类方法上引入成员分类器权重的在线更新机制,结合重采样和自适应滑动窗口技术,提出了一种基于G-mean加权的不平衡数据流在线分类 方法(online G-mean update ensemble for imbalance learning,OGUEIL).该方法基于集成学 习 框架,利用时间衰减因子增量计算成员分类器最近若干实例上的G-mean性能,并确定成员分类器权重,每到达一个新实例,在线更新所有成员分类器及其权重,并对少类实例进行随机过采样.同时,OGUEIL会周期性地根据当前数据构造类别平衡数据集训练新的候选分类器,并选择性地添加至集成框架中.在真实和人工数据集上的结果表明,所提方法的综合性能优于其他同类方法.

关键词

数据流/概念漂移/集成学习/类别不平衡/分类

引用本文复制引用

基金项目

国家自然科学基金(62072216)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量1
参考文献量1
段落导航相关论文