基于梯度惩罚生成对抗网络的过采样算法

Oversampling algorithm based on gradient penalty generative adversarial network

陶家亮 ¹魏国亮 ²宋燕 ³窦军 ³穆伟蒙¹

扫码查看

作者信息

1. 上海理工大学理学院,上海 200093
2. 上海理工大学管理学院,上海 200093
3. 上海理工大学光电信息与计算机工程学院,上海 200093
折叠

摘要

在不平衡数据分类问题中,为了更注重学习原始样本的概率密度分布,提出基于梯度惩罚生成对抗网络的过采样算法(OGPG).该算法首先引入生成对抗网络(GAN),有效地学习原始数据的概率分布;其次,采用梯度惩罚对判别器输入项的梯度二范数进行约束,降低了GAN易出现的过拟合和梯度消失,合理地生成新样本.实验部分,在 14 个公开数据集上运用k近邻和决策树分类器对比其他过采样算法,在评价指标上均有显著提升,并利用Wilcoxon符号秩检验验证了该算法与对比算法在统计学上的差异.结果表明该算法具有良好的有效性和通用性.

关键词

不平衡数据/过采样算法/概率密度分布/生成对抗网络/梯度惩罚

Key words

imbalanced data/oversampling algorithm/probability density distribution/GAN/gradient penalty

引用本文复制引用

基金项目

国家自然科学基金资助项目(61873169)

上海市"科技创新行动计划"国内科技合作项目(20015801100)

出版年

2023

上海理工大学学报

上海理工大学

上海理工大学学报

CSCD北大核心

影响因子：0.767

ISSN：1007-6735

参考文献量5

段落导航