计算机研究与发展2022,Vol.59Issue(1) :127-143.DOI:10.7544/issn1000-1239.20200562

基于时序窗口的概念漂移类别检测

Concept Drift Class Detection Based on Time Window

郭虎升 任巧燕 王文剑
计算机研究与发展2022,Vol.59Issue(1) :127-143.DOI:10.7544/issn1000-1239.20200562

基于时序窗口的概念漂移类别检测

Concept Drift Class Detection Based on Time Window

郭虎升 1任巧燕 2王文剑1
扫码查看

作者信息

  • 1. 山西大学计算机与信息技术学院 太原030006;计算智能与中文信息处理教育部重点实验室(山西大学) 太原030006
  • 2. 山西大学计算机与信息技术学院 太原030006
  • 折叠

摘要

流数据作为一种新型数据,在各个领域均有应用,其快速、大量及持续不断的特点使得单遍精准扫描成为在线学习算法的必备特质.在流数据不断产生过程中,往往会发生概念漂移,目前对于概念漂移节点检测的研究相对成熟,然而实际问题中学习环境因素朝不同方向发展往往会导致流数据中概念漂移类别的多样性,这给流数据挖掘及在线学习带来了新的挑战.针对这个问题,提出一种基于时序窗口的概念漂移类别检测(concept drift class detection based on time window,CD-TW)方法.该方法借助栈和队列对流数据进行存取,借助窗口机制对流数据进行分块学习.首先创建2个分别加载历史数据和当前数据的基础节点时序窗口,通过比较二者所包含数据的分布变化情况来检测概念漂移节点.然后创建加载漂移节点后部分数据的跨度时序窗口,通过分析该窗口中数据分布的稳定性检测漂移跨度,进而判断概念漂移类别.实验结果表明该方法不仅能够精确定位概念漂移节点,同时在漂移类别判断方面也表现出良好性能.

关键词

流数据/概念漂移/时序窗口/漂移跨度/概念漂移类别

引用本文复制引用

基金项目

国家自然科学基金(61503229)

国家自然科学基金(U1805263)

国家自然科学基金(62076154)

山西省自然科学基金(201901D111033)

山西省重点研发计划国际合作项目(201903D421050)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量6
参考文献量5
段落导航相关论文