首页|基于谱聚类的不平衡数据欠采样方法研究

基于谱聚类的不平衡数据欠采样方法研究

扫码查看
不平衡数据的分类问题在数据挖掘和机器学习领域中,一直是备受关注的问题.论文从数据预处理方面出发,提出一种基于谱聚类的欠采样方法,以此来降低数据的不平衡程度.先对多类样本进行谱聚类,根据每个聚类簇的密集程度,以及到少类样本的平均距离,来计算每个聚类簇的采样数目和选取怎样的多类样本,此欠采样方法可以有效去除多数类的冗余数据.实验结果证明,该算法可以有效提升少类样本的分类效果.
Research on Unbalanced Data Under-sampling Method Based on Spectral Clustering

杨晓月

展开 >

南京理工大学计算机科学与工程学院 南京 210094

不平衡数据 谱聚类 欠采样 支持向量机

2021

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2021.49(11)
  • 1
  • 2