首页|基于密度峰值和K近邻的密度均衡采样方法

基于密度峰值和K近邻的密度均衡采样方法

扫码查看
为了解决样本空间分布和合成数据之间的冲突,结合密度峰值和K近邻理论,提出了一种处理不平衡数据集的密度均衡算法,根据数据集空间分布进行有指向性的样本合成.使用K近邻算法、随机森林和支持向量机作为基分类器对不同不平衡比率的数据集进行验证.结果表明:所提出的密度均衡算法在多个数据集上表现较好的准确性和鲁棒性,特别在不平衡比率较大的数据集中比其他处理方法获得更好的分类效果.
A density equalization sampling method based on density peaks clustering and K nearest neighbor

imbalanced dataK nearest neighbordensity peak clusteringdensity balance

吴帅、陈宁江

展开 >

广西大学计算机与电子信息学院,广西南宁530004

广西高校并行分布与智能计算重点实验室,广西南宁530004

广西智能数字服务工程技术研究中心,广西南宁530004

不平衡数据 K近邻 密度峰值 密度均衡

国家重点研发计划课题国家重点研发计划课题国家自然科学基金

2017YFC16020012017YFC160200562162003

2023

广西大学学报(自然科学版)
广西大学

广西大学学报(自然科学版)

CSTPCD北大核心
影响因子:0.767
ISSN:1001-7445
年,卷(期):2023.48(4)
  • 10