计算机研究与发展2021,Vol.58Issue(11) :2485-2499.DOI:10.7544/issn1000-1239.2021.20200523

基于空间变换的随机森林算法

Space Transformation Based Random Forest Algorithm

关晓蔷 王文剑 庞继芳 孟银凤
计算机研究与发展2021,Vol.58Issue(11) :2485-2499.DOI:10.7544/issn1000-1239.2021.20200523

基于空间变换的随机森林算法

Space Transformation Based Random Forest Algorithm

关晓蔷 1王文剑 2庞继芳 1孟银凤3
扫码查看

作者信息

  • 1. 山西大学计算机与信息技术学院 太原 030006
  • 2. 山西大学计算机与信息技术学院 太原 030006;计算智能与中文信息处理教育部重点实验室(山西大学) 太原 030006
  • 3. 山西大学数学科学学院 太原 030006
  • 折叠

摘要

随机森林是机器学习领域中一种常用的分类算法,具有适用范围广且不易过拟合等优点.为了提高随机森林处理多分类问题的能力,提出一种基于空间变换的随机森林算法(space transformation based random forest algorithm,ST-RF).首先,给出一种考虑优先类别的线性判别分析方法(priority class based linear discriminant analysis,PCLDA),利用针对优先类别的投影矩阵对样本进行空间变换,以增强优先类别样本与其他类别样本的区分效果进而,将PCLDA方法引入随机森林构建过程中,在为每棵决策树随机选择一个优先类别保证随机森林多样性的基础上,利用PCLDA方法创建侧重于不同优先类别的决策树,以提高单棵决策树的分类准确性,从而实现集成模型整体分类性能的有效提升最后,在10个标准数据集上对ST-RF算法与7种典型随机森林算法进行比较分析,验证所提算法的有效性,并将基于PCLDA的空间变换策略应用到对比算法中,对改进前后的算法性能进行比较分析.实验结果表明:ST-RF算法在处理多分类问题方面具有明显优势,所提出的空间变换策略具有较强的普适性,可以显著提升原算法的分类性能.

关键词

随机森林/优先类别/线性判别分析/空间变换/决策树

引用本文复制引用

基金项目

国家自然科学基金(61876103)

国家自然科学基金(61673249)

国家自然科学基金(U1805263)

国家自然科学基金(62006148)

山西省重点研发计划项目(201903D421050)

山西省1331工程项目()

出版年

2021
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量5
参考文献量2
段落导航相关论文