首页|谱聚类欠取样下自编码网络不平衡数据挖掘

谱聚类欠取样下自编码网络不平衡数据挖掘

扫码查看
不平衡数据集的应用领域日益广泛,需求也越来越高,为提升整体数据集的分类准确率,以谱聚类欠取样为前提条件,构建一种自编码网络不平衡数据挖掘方法.把聚类问题转换成无向图多路径划分问题,通过无向图与标准化处理完成谱聚类,经过有选择地欠取样处理多数类数据集,获取分类边界偏移量,利用学习过程是无监督学习的自编码网络,升、降维数据,获取各维度隐藏特征,实现各层面的数据高效表示学习,根据最大均值差异与预设阈值的对比结果,调整自编码网络,基于得到的分类界面,完成不平衡数据挖掘.选用具有不同实际应用背景的UCI数据集,从中抽取10组数据作为测试集,经谱聚类欠取样处理与模拟实验,发现所提方法大幅提升少数类分类精度与整体挖掘性能,具有较好的适用性与可行性.
Unbalanced Data Mining of Self-Encoding Network under Spectral Clustering Undersampling

王舒梵、严涛、姜新盈

展开 >

上海工程技术大学数理与统计学院,上海201620

谱聚类 欠取样 自编码网络 不平衡数据 分类边界 聚类中心

2021

计算机系统应用
中国科学院软件研究所

计算机系统应用

CSTPCD
影响因子:0.449
ISSN:1003-3254
年,卷(期):2021.30(10)
  • 1
  • 13