计算机应用研究2021,Vol.38Issue(4) :1051-1057.DOI:10.19734/j.issn.1001-3695.2020.04.0106

基于特征交互与权重集成的癌症分类方法

Cancer classification method based on feature interaction and weight integration

陈昊楠 金敏
计算机应用研究2021,Vol.38Issue(4) :1051-1057.DOI:10.19734/j.issn.1001-3695.2020.04.0106

基于特征交互与权重集成的癌症分类方法

Cancer classification method based on feature interaction and weight integration

陈昊楠 1金敏1
扫码查看

作者信息

  • 1. 湖南大学 信息科学与工程学院,长沙410082
  • 折叠

摘要

在癌症分类研究领域,高维、高冗余、类分布不平衡的基因表达数据如何进行特征选择与分类模型构建一直是影响分类准确率的难点.为了提高癌症分类的准确率,提出了基于特征交互与权重集成的癌症分类方法.在特征选择层面,利用多特征对分类信息的增益性交互作用来选出对于标签联合互信息大于单独互信息之和的特征组合,并利用条件互信息选择低冗余的特征,解决基因表达数据的高维、高冗余问题.在分类模型层面,提出结合权重集成反馈机制的二次学习集成模型,综合不同模型对不同类别样本的差异拟合能力,构造不依赖于样本数量的类权重,解决数据类分布不平衡的问题.应用该方法对六种癌症数据进行分类测试,accuracy、sensitivity、precision和F-measure四项指标均稳定在99.39%以上、specificity在94.74%以上,表明该方法能有效提高癌症分类的准确率和稳定性,同时具有对于不同癌症分类的通用性.

关键词

癌症分类/数据科学/特征交互/多元异构模型/权重集成反馈/二次学习集成模型

引用本文复制引用

基金项目

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量2
参考文献量3
段落导航相关论文