陕西师范大学学报(自然科学版)2020,Vol.48Issue(6) :69-81.

基于信息增益与皮尔森相关系数的2D自适应特征选择算法

An adaptive 2D feature selection algorithm based on information gain and Pearson correlation coefficient

谢娟英 吴肇中 郑清泉
陕西师范大学学报(自然科学版)2020,Vol.48Issue(6) :69-81.

基于信息增益与皮尔森相关系数的2D自适应特征选择算法

An adaptive 2D feature selection algorithm based on information gain and Pearson correlation coefficient

谢娟英 1吴肇中 1郑清泉1
扫码查看

作者信息

  • 1. 陕西师范大学 计算机科学学院,陕西 西安 710119
  • 折叠

摘要

针对基因表达数据的高维小样本特点,提出基于信息增益与皮尔森相关系数的2D自适应特征选择算法FSIP(feature selection based on information gain and Pearson correlation coeffi-cient).以特征的信息增益度量相应特征所携带的信息量,定义特征辨识度来度量特征的辨识能力大小,采用皮尔森相关系数定义特征独立性.为了尽可能选择到辨识能力和独立性都很好的特征,并能调和特征的辨识度与独立性对分类的贡献,定义两者之积为特征重要性,自适应地选择重要性远高于其余特征重要性的特征构成特征子集.以核极限学习机K-ELM(kernel extreme learning machine)为分类器,评价所选择特征子集的分类性能.基因数据集的实验测试以及与经典特征选择算法SVM-RFE、DRJMIM、mRMR、LLE Score、AMID、AVC的实验对比和统计重要性检测表明,提出的FSIP特征选择算法能够选择出分类能力很好的特征子集,基于被选特征子集的K-ELM具有很好的分类性能.

关键词

信息增益/皮尔森相关系数/特征选择/极限学习机/特征相关性

引用本文复制引用

基金项目

国家自然科学基金(61673251)

国家自然科学基金(62076159)

国家自然科学基金(12031010)

国家重点研发计划(2016YFC0901900)

科技成果转化培育项目(GK201806013)

研究生培养创新基金(2015CXS028)

研究生培养创新基金(2016CSY009)

出版年

2020
陕西师范大学学报(自然科学版)
陕西师范大学

陕西师范大学学报(自然科学版)

CSTPCDCSCD北大核心
影响因子:0.563
ISSN:1672-4291
被引量13
参考文献量7
段落导航相关论文