重庆理工大学学报2022,Vol.36Issue(7) :281-292.DOI:10.3969/j.issn.1674-8425(z).2022.07.035

生物医学中高维非均衡数据整合算法

Integration algorithm to high-dimensional and disequilibrium biomedicine data

肖枝洪 李季 王一超
重庆理工大学学报2022,Vol.36Issue(7) :281-292.DOI:10.3969/j.issn.1674-8425(z).2022.07.035

生物医学中高维非均衡数据整合算法

Integration algorithm to high-dimensional and disequilibrium biomedicine data

肖枝洪 1李季 1王一超2
扫码查看

作者信息

  • 1. 重庆理工大学 理学院,重庆 400054
  • 2. 内蒙古赤峰市昭乌达中学,内蒙古 赤峰 024099
  • 折叠

摘要

针对随机森林算法(RF)以及过采样技术处理高维非均衡数据的不足,提出了新的算法:首先结合RF模型基尼系数与袋外数据准确率提出MAG算法,并用此算法对高维数据进行降维处理;其次用动态离差平方和机器学习方法改进中心SMOTE算法来优化非均衡数据少样本结构,使数据结构成为低维均衡结构;最后运用最小二乘支持向量机(LSSVM)与RF对整合数据进行分类来判定所提出的算法的有效性.RF分类器和LSSVM分类器的实验结果表明:所提出的MAG-PDSSD-SMOTE算法整合数据较已有方法在F-value值、G-mean值和Accuracy值上都有显著的提高,所提出算法整合数据较已有方法更精准,但从时间复杂度来看,提出的MAG-PDSSD-SMOTE算法比已有方法复杂一点,但还是处于同一个数量级别.

关键词

MAG-PDSSD-SMOTE算法/随机森林/高维非均衡数据/数据处理

引用本文复制引用

基金项目

国家社会科学基金重点项目(17AJY028)

重庆理工大学研究生创新项目(clgycx20203142)

出版年

2022
重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
参考文献量13
段落导航相关论文