计算机研究与发展2023,Vol.60Issue(7) :1592-1602.DOI:10.7544/issn1000-1239.202220245

基于在线集成的概念漂移自适应分类方法

Adaptive Classification Method for Concept Drift Based on Online Ensemble

郭虎升 丛璐 高淑花 王文剑
计算机研究与发展2023,Vol.60Issue(7) :1592-1602.DOI:10.7544/issn1000-1239.202220245

基于在线集成的概念漂移自适应分类方法

Adaptive Classification Method for Concept Drift Based on Online Ensemble

郭虎升 1丛璐 2高淑花 2王文剑1
扫码查看

作者信息

  • 1. 山西大学计算机与信息技术学院 太原 030006;计算智能与中文信息处理教育部重点实验室(山西大学) 太原 030006
  • 2. 山西大学计算机与信息技术学院 太原 030006
  • 折叠

摘要

针对流数据中概念漂移发生后,在线学习模型不能对分布变化后的数据做出及时响应且难以提取数据分布的最新信息,导致学习模型收敛较慢的问题,提出一种基于在线集成的概念漂移自适应分类方法(adaptive classification method for concept drift based on online ensemble,AC_OE).一方面,该方法利用在线集成策略构建在线集成学习器,对数据块中的训练样本进行局部预测以动态调整学习器权重,有助于深入提取漂移位点附近流数据的演化信息,对数据分布变化进行精准响应,提升在线学习模型对概念漂移发生后新数据分布的适应能力,提高学习模型的实时泛化性能;另一方面,利用增量学习策略构建增量学习器,并随新样本的进入进行增量式的训练更新,提取流数据的全局分布信息,使模型在平稳的流数据状态下保持较好的鲁棒性.实验结果表明,该方法能够对概念漂移做出及时响应并加速在线学习模型的收敛速度,同时有效提高学习器的整体泛化性能.

关键词

流数据/概念漂移/在线集成/增量学习/自适应模型

引用本文复制引用

基金项目

国家自然科学基金(62276157)

国家自然科学基金(U21A20513)

国家自然科学基金(62076154)

国家自然科学基金(U1805263)

国家自然科学基金(61503229)

山西省自然科学基金(201901D111033)

山西省重点研发计划(国际合作)(201903D421050)

出版年

2023
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量1
参考文献量6
段落导航相关论文