计算机应用研究2021,Vol.38Issue(6) :1673-1677.DOI:10.19734/j.issn.1001-3695.2020.08.0228

邻域自适应SMOTE算法研究

Research on neighborhood adaptive SMOTE algorithm

王芳 吴文通 张立立 马瑞 徐文星
计算机应用研究2021,Vol.38Issue(6) :1673-1677.DOI:10.19734/j.issn.1001-3695.2020.08.0228

邻域自适应SMOTE算法研究

Research on neighborhood adaptive SMOTE algorithm

王芳 1吴文通 1张立立 1马瑞 1徐文星2
扫码查看

作者信息

  • 1. 北京石油化工学院 信息工程学院,北京 102617
  • 2. 北京石油化工学院 信息工程学院,北京 102617;北京石油化工学院 人工智能研究院,北京 102617
  • 折叠

摘要

针对SMOTE(synthetic minority over-sampling technique)等基于近邻值的传统过采样算法在处理类不平衡数据时近邻参数不能根据少数类样本的分布及时调整的问题,提出邻域自适应SMOTE算法AdaN_SMOTE.为使合成数据保留少数类的原始分布,跟踪精度下降点确定每个少数类数据的近邻值,并根据噪声、小析取项或复杂的形状及时调整近邻值的大小;合成数据保留了少数类的原始分布,算法分类性能更佳.在KE E L数据集上进行实验对比验证,结果表明AdaN_SMOTE分类性能优于其他基于近邻值的过采样方法,且在有噪声的数据集中更有效.

关键词

类不平衡/数据分布/自适应邻域大小/精度下降点/人工合成少数类过采样

引用本文复制引用

基金项目

北京市属高校青年拔尖人才培育计划项目(CIT&TCD201704048)

北京市教委—市自然科学基金(KZ202110017025)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量4
参考文献量1
段落导航相关论文