计算机技术与发展2020,Vol.30Issue(3) :40-45.

基于特征约简的随机森林改进算法研究

An Improved Random Forest Algorithm Based on Feature Reduction

王诚 高蕊
计算机技术与发展2020,Vol.30Issue(3) :40-45.

基于特征约简的随机森林改进算法研究

An Improved Random Forest Algorithm Based on Feature Reduction

王诚 1高蕊1
扫码查看

作者信息

  • 1. 南京邮电大学 通信与信息工程学院,江苏 南京 210003
  • 折叠

摘要

随机森林(random forest,RF)算法虽应用广泛且分类准确度很高,但在面对特征维度高且不平衡的数据时,算法分类性能被严重削弱.高维数据通常包含大量的无关和冗余的特征,针对这个问题,结合权重排序和递归特征筛选的思想提出了一种改进的随机森林算法RW RF(ReliefF&wrapper random forest).首先引用ReliefF算法对数据集的所有特征按正负类分类能力赋予不同的权值,再递归地删除冗余的低权值特征,得到分类性能最佳的特征子集来构造随机森林;同时改进ReliefF的抽样方式,以减轻不平衡数据对分类模型的影响.实验结果显示,在特征数目很多的数据集中,改进算法的各评价指标均高于原算法,证明提出的RW RF算法有效精简了特征子集,减轻了冗余特征对模型分类精度的影响,同时也证明了改进算法对处理不平衡数据起到了一定的效果.

关键词

随机森林/权重排序/特征约简/抽样方式/RWRF算法

引用本文复制引用

基金项目

中国博士后科学基金(SBH18028)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量3
参考文献量3
段落导航相关论文