国家学术搜索
登录
注册
中文
EN
首页
|
基于谱聚类的不平衡数据欠采样方法研究
基于谱聚类的不平衡数据欠采样方法研究
下载
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
国家科技期刊平台
NETL
NSTL
万方数据
维普
中文摘要:
不平衡数据的分类问题在数据挖掘和机器学习领域中,一直是备受关注的问题.论文从数据预处理方面出发,提出一种基于谱聚类的欠采样方法,以此来降低数据的不平衡程度.先对多类样本进行谱聚类,根据每个聚类簇的密集程度,以及到少类样本的平均距离,来计算每个聚类簇的采样数目和选取怎样的多类样本,此欠采样方法可以有效去除多数类的冗余数据.实验结果证明,该算法可以有效提升少类样本的分类效果.
外文标题:
Research on Unbalanced Data Under-sampling Method Based on Spectral Clustering
收起全部
展开查看外文信息
作者:
杨晓月
展开 >
作者单位:
南京理工大学计算机科学与工程学院 南京 210094
关键词:
不平衡数据
谱聚类
欠采样
支持向量机
出版年:
2021
DOI:
10.3969/j.issn.1672-9722.2021.11.025
计算机与数字工程
中国船舶重工集团公司第七0九研究所
计算机与数字工程
CSTPCD
影响因子:
0.355
ISSN:
1672-9722
年,卷(期):
2021.
49
(11)
被引量
1
参考文献量
2