陕西师范大学学报(自然科学版)2020,Vol.48Issue(2) :1-8.

F-score结合核极限学习机的集成特征选择算法

An ensemble feature selection algorithm based on F-score and kernel extreme learning machine

谢娟英 郑清泉 吉新媛
陕西师范大学学报(自然科学版)2020,Vol.48Issue(2) :1-8.

F-score结合核极限学习机的集成特征选择算法

An ensemble feature selection algorithm based on F-score and kernel extreme learning machine

谢娟英 1郑清泉 1吉新媛1
扫码查看

作者信息

  • 1. 陕西师范大学 计算机科学学院,陕西 西安 710119
  • 折叠

摘要

特征选择是高维小样本癌症基因数据分析的首要和关键步骤,但是现有特征选择算法存在特征子集依赖于训练样本且随训练样本不同而变化的问题.为了解决特征选择过程的特征子集不稳定问题,提出一种基于核极限学习机的集成特征选择方法,利用5-折交叉验证划分原始数据,对各训练集继续采用5-折交叉验证进行划分并进行特征选择,以所得5个特征子集之并集作为该训练集的特征子集,构造核极限学习机评价该特征子集的分类性能,以原始数据集5-折交叉验证所得特征子集的平均Jaccard系数评价特征选择算法所选特征子集的稳定性.5个基因数据集的实验测试以及与经典特征选择算法SVM-RFE、LLE Score、ARCO、DRJMIM、Random Forest和mRMR的实验比较表明,本文算法不仅能选择到稳定的特征子集,且所选特征子集具有很好的泛化能力.

关键词

F-score/特征选择/极限学习机/集成特征选择

引用本文复制引用

基金项目

国家自然科学基金(61673251)

国家重点研发计划(2016YFC0901900)

科技成果转化培育项目(GK201806013)

研究生培养创新基金(2016CSY009)

出版年

2020
陕西师范大学学报(自然科学版)
陕西师范大学

陕西师范大学学报(自然科学版)

CSTPCDCSCD北大核心
影响因子:0.563
ISSN:1672-4291
被引量7
参考文献量6
段落导航相关论文