首页|基于决策树集成学习在癌症风险分层中的应用

基于决策树集成学习在癌症风险分层中的应用

扫码查看
论文提出了基于决策树集成学习的癌症风险分层方法,并将其应用在TCGA癌症数据集.首先对原始数据进行数据清洗与预处理,构建基于决策树集成学习的生存分析模型;针对每个算法进行贝叶斯超参数优化,获得最优的C-in-dex和time-dependent AUC性能评价值,结果表明随机生存森林RSF和梯度提升树GBM性能较好.基于RSF和GBM风险评分进行癌症风险分层,在识别高危和低危患者群体方面具有显著作用.
Application of Decision Tree-based Ensemble Learning in Cancer Risk Stratification
The paper proposes a cancer risk stratification method based on decision tree ensemble learning,and applies it on the TCGA cancer data set.Decision tree ensemble-based survival analysis model is constructed on the preprocessed data set,and the optimal hyperparameter by is chosen Bayesian optimization method.C-index and time-dependent AUC evaluation values show that random forest(RSF)and gradient boosting tree(GBM)are better than other algorithms.It shows that the cancer risk stratifica-tion method based on RSF and GBM risk scores plays a significant role in identifying high-risk and low-risk patients.

ensemble learningrandom survival forestgradient boosting treesurvival analysisrisk stratification

殷清燕、车露美、刘星宇

展开 >

西安建筑科技大学 西安 710055

西安邮电大学 西安 710121

集成学习 随机生存森林 梯度提升树 生存分析 风险分层

西安市科技局项目

2019218114GXRC017CG018-GXYD17.6

2024

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2024.52(1)
  • 16