首页|基于GAN的数据平衡化问题实验对比分析

基于GAN的数据平衡化问题实验对比分析

Experimental Comparative Analysis of Data Balancing Based on GAN

扫码查看
数据不平衡指数据集中各类别的样本数量极不均衡,实际应用中这类问题经常出现.研究了传统的数据过采样技术RANDOM、SMOTE、AD AS YN以及目前流行的深度学习技术GAN.基于加利福尼亚大学16个非图像机器学习数据集,通过大量实验对传统过采样技术以及CGAN、WGAN进行评估.通过对比分析发现:在训练样本不充足的情况下,相对于CGAN及传统的过采样技术,WGAN能够产生更好的样本,从而获得更高的测试精度.同时,研究发现训练样本的不平衡率是影响CGAN和WGAN过采样技术运行结果的重要因素.

over-samplingimbalanced datadata augmentation methods

王志勇、张翠萍

展开 >

潍坊科技学院 计算机学院,山东 寿光 262700

韩国东西大学 计算机工程学院,韩国 釜山 47011

过采样 不平衡数据 数据增强技术

山东省重点研发计划(软科学)项目潍坊科技学院博士科研启动项目潍坊科技学院社会服务项目

2020RKA070322021KJBS14WZSF20210047

2023

宁夏大学学报(自然科学版)
宁夏大学

宁夏大学学报(自然科学版)

CSTPCDCHSSCD
影响因子:0.377
ISSN:0253-2328
年,卷(期):2023.44(2)
  • 8