首页|一种增强少数类边界的多类不平衡过抽样算法

一种增强少数类边界的多类不平衡过抽样算法

扫码查看
多类不平衡数据的过抽样分类方法有助于解决多类实例平衡及提高分类准确率,但在过抽样生成合成实例过程中也面临着两个主要难题:一是怎样区分每个少数类中的有限实例在生成合成实例时的重要性,二是在生成合成实例后能否更加清楚地划分多数类与少数类的边界.针对此问题,提出了一种增强多类不平衡中少数类实例边界实例方法.其思路是根据少数类实例中边界实例在分类中的重要作用,越靠近边界的少数类实例赋予的权重越大,这样就可在边界处生成更多合成少数类实例,从而达到进一步加强少数类处边界的效果,同时也克服了多数类实例的学习偏差,最终使得多类平衡数据达到一定程度的平衡.实验结果表明,本算法既能很好地区分每个少数类实例在生成合成实例时的重要程度,还能更加清楚地区分多数类与少数类的边界,在不平衡数据分类的4个常用评价指标上,其查准率、查全率、F-Measure和G-mean均获得了较好的效果.
An Oversampling Algorithm of Enhanced Minority Instance Boundary in Multi-class Imbalanced Datasets

曹兰

展开 >

漳州职业技术学院电子工程学院,福建 漳州 363000

数据挖掘 过抽样 分类 评价指标

福建省中青年教师教育科研项目

科技类JAT191419

2021

四川轻化工大学学报(自然科学版)

四川轻化工大学学报(自然科学版)

ISSN:
年,卷(期):2021.34(6)
  • 7