计算机应用研究2021,Vol.38Issue(9) :2667-2672.DOI:10.19734/j.issn.1001-3695.2021.01.0007

一种面向高维缺失不平衡数据的信用评估方法

Credit evaluation method for high dimensional missing unbalanced data

樊东醒 叶春明
计算机应用研究2021,Vol.38Issue(9) :2667-2672.DOI:10.19734/j.issn.1001-3695.2021.01.0007

一种面向高维缺失不平衡数据的信用评估方法

Credit evaluation method for high dimensional missing unbalanced data

樊东醒 1叶春明1
扫码查看

作者信息

  • 1. 上海理工大学 管理学院,上海200093
  • 折叠

摘要

传统随机森林填补方法并未考虑高维不平衡问题导致填补没有针对性,且使用0值预填补的方式可能会引入噪声并导致预测精度降低,因此提出一种基于Q学习和随机森林的缺失值填补方法(QL-RF).该方法在特征选择后使用Q-learning权衡填补精度和填补数量,通过计算奖励筛选出具有填补价值的样本和特征组合,然后利用冗余特征填补重要特征中的缺失,并重点填补了少数类样本.此外,为提高不平衡数据下的分类效果,基于Bagging框架提出一种融合量子粒子群算法(QPSO)和XGBoost的集成分类模型(QXB).实验表明:QL-RF在G-means、F1-measure、AUC指标下均优于传统RF填补法,QXB显著优于SMOTE-RF和SMOTE-XGBoost,所提方法能够有效地处理高维不平衡数据下的缺失和分类问题.

关键词

高维不平衡/QL-RF/Bagging/QPSO/XGBoost/QXB

引用本文复制引用

基金项目

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
参考文献量17
段落导航相关论文