查看更多>>摘要:数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真实场景下是不现实的.此外,真实数据流可能表现出较高且不断变化的类不平衡比率,会进一步增加数据流分类任务的复杂性.为此,提出一种非平衡概念漂移数据流主动学习方法(Active learning method for imbalanced concept drift data stream,ALM-ICDDS).定义基于多预测概率的样本预测确定性度量,提出边缘阈值矩阵的自适应调整方法,使得标签查询策略适用于类别数较多的非平衡数据流;提出基于记忆强度的样本替换策略,将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中,提升新基分类器的分类性能;定义基于分类精度的基分类器重要性评价及更新方法,实现漂移后的集成分类器更新.在7个合成数据流和3个真实数据流上的对比实验表明,提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法.
查看更多>>摘要:针对现有异常检测(Anomaly detection,AD)模型计算效率低和检测性能差等问题,提出一种多尺度流模型(Multi-scale normalizing flow,MS-Flow),通过多尺度交叉融合实现高效的视觉图像异常识别.具体地,在流模型(Nor-malizing flow,NF)内部构建层级式的多尺度架构来避免多通道数据的冗余交叉计算,同时保证网络的多尺度表达能力.此外,设计的层级感知模块通过逐层级的多粒度特征融合,在细粒度级别表达多尺度特征,有效地提高分布估计的精确性.该方法是一个平衡检测精度与计算效率的解决方案.在两个公开数据集上的实验表明,所提方法相较于以往的检测模型能够获得更高的检测精度(在 MVTec AD 和 BTAD 数据集上的平均 AUROC(Area under the receiver operating characteristics)分别为99.7%和96.0%),同时具有更高的计算效率,浮点运算次数(Floating point operations,FLOPs)约为CS-Flow的1/8.