计算机研究与发展2022,Vol.59Issue(3) :633-646.DOI:10.7544/issn1000-1239.20201017

面向概念漂移数据流的自适应分类算法

Adaptive Classification Algorithm for Concept Drift Data Stream

蔡桓 陆克中 伍启荣 吴定明
计算机研究与发展2022,Vol.59Issue(3) :633-646.DOI:10.7544/issn1000-1239.20201017

面向概念漂移数据流的自适应分类算法

Adaptive Classification Algorithm for Concept Drift Data Stream

蔡桓 1陆克中 1伍启荣 1吴定明1
扫码查看

作者信息

  • 1. 深圳大学计算机与软件学院 广东深圳 518061
  • 折叠

摘要

数据流分类是数据挖掘中最重要的任务之一,而数据流的概念漂移特性给分类算法带来了巨大的挑战.基于极限学习机算法进行优化是解决数据流分类问题的一个热门方向,但目前大多数算法都采用提前指定模型参数的方式进行学习,这种做法使得分类模型只能在特定的数据集上才能发挥较好的性能.针对这一问题,提出了一种简单有效的处理概念漂移的算法——自适应在线顺序极限学习机分类算法.算法通过引入自适应模型复杂度机制,从而具有更好的分类性能.然后通过引入自适应遗忘因子与概念漂移检测机制,能够根据动态变化的数据流进行自适应学习,从而可以更好地适应概念漂移.进一步还引入异常点检测机制,避免分类决策边界被异常点破坏.仿真实验表明,所提出算法比同类算法具有更好的稳定性、分类准确性以及概念漂移适应能力.此外,还通过消融实验证实了算法所引入3个机制的有效性.

关键词

数据流分类/在线学习/极限学习机/概念漂移/自适应机制

引用本文复制引用

基金项目

国家自然科学基金(61502310)

广东省自然科学基金(2019A1515011064)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量3
参考文献量5
段落导航相关论文