重庆理工大学学报2022,Vol.36Issue(4) :187-195.DOI:10.3969/j.issn.1674-8425(z).2022.04.023

一种新的基于聚类的试探性SMOTE算法

New tentative SMOTE algorithm based on clustering

王曜 郑列
重庆理工大学学报2022,Vol.36Issue(4) :187-195.DOI:10.3969/j.issn.1674-8425(z).2022.04.023

一种新的基于聚类的试探性SMOTE算法

New tentative SMOTE algorithm based on clustering

王曜 1郑列1
扫码查看

作者信息

  • 1. 湖北工业大学理学院,武汉 430068
  • 折叠

摘要

针对传统过采样算法中常常出现的生成噪声点、数据分布边缘化、未增强足够特征的问题,提出了一种新算法:试探性少数类过采样技术(tentative synthetic minority over-sampling technique,TSMOTE).该算法先将少数类样本进行K-means聚类,然后创建正类安全水平等指标,运用试探性的思想,放出试探点求出每个少数类样本对应的警戒点,获取最适合新样本生成的空间区域,最后在簇心和警戒点之间进行合成少数类过采样技术(synthetic minority over-sam-pling technique,SMOTE),确保新样本的生成质量.在12个公开数据集上的大量实验表明:TSMOTE算法可以有效提高分类器对少数类样本和整体数据集的分类性能.

关键词

不平衡数据/试探性/K-means/SMOTE/安全水平

引用本文复制引用

基金项目

教育部人文社会科学研究规划基金(17YJA790098)

出版年

2022
重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
被引量2
参考文献量4
段落导航相关论文