计算机技术与发展2022,Vol.32Issue(7) :155-160.DOI:10.3969/j.issn.1673-629X.2022.07.027

融合人类知识的随机森林特征选择方法研究

Research on Random Forest Feature Selection Method by Human Knowledge

戴贵洋 綦秀利 余晓晗
计算机技术与发展2022,Vol.32Issue(7) :155-160.DOI:10.3969/j.issn.1673-629X.2022.07.027

融合人类知识的随机森林特征选择方法研究

Research on Random Forest Feature Selection Method by Human Knowledge

戴贵洋 1綦秀利 1余晓晗1
扫码查看

作者信息

  • 1. 陆军工程大学 指挥控制工程学院,江苏 南京 210007
  • 折叠

摘要

特征选择可以从原始特征空间中选择出一些最有效的特征以降低数据特征维度,提高学习算法性能.在数据降维问题中,常见的特征选择方法主要依靠数据本身的统计特性,通过数据本身信息选择更有效的特征,然而一些实际问题中往往积累了大量人类经验,这些人类知识可能对特征选择有重要影响,但很少有特征选择方法考虑使用这些人类知识.针对此类包含人类知识问题,并兼顾人类知识和采集数据的特征选择方法,提出了基于随机森林和模糊系统的二次筛选的特征选择模型.该模型通过随机森林算法剔除原始数据集中的冗余特征,实现初步筛选,利用初选特征中包含的人类知识搭建模糊系统,对初选特征计算评估得分,筛选出最终的关键特征.在汽油提纯真实数据集上进行了实验,相较于常规特征选择方法,该模型有显著提升,验证了结合人类知识随机森林特征选择方法的有效性.

关键词

特征选择/随机森林/人类知识/模糊系统/数据降维

引用本文复制引用

基金项目

国家自然科学基金(61806221)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量3
参考文献量5
段落导航相关论文