首页|基于XGBoost和随机生存森林的Cox半参数回归模型及应用

基于XGBoost和随机生存森林的Cox半参数回归模型及应用

王雅婷

基于XGBoost和随机生存森林的Cox半参数回归模型及应用

王雅婷1
扫码查看

作者信息

  • 1. 兰州大学
  • 折叠

摘要

生存分析被广泛应用于医疗、经济、工业、社会科学等领域,生存分析用于研究生存现象和生存时间及其影响因素的统计规律,目前已经有很多传统的统计推断方法在生存分析领域被广泛应用.近年来,随着机器学习算法的快速发展,已有很多算法被引入生存分析领域并在实践中验证了此类算法优越的建模能力和预测性能. 本篇论文的目的是基于生存分析提出一种新的回归算法SurvivalBoost,该算法基于随机生存森林和XGBoost.同时,为了让算法更有效地处理生存数据,本文将弹性网络的惩罚项和Cox比例风险模型引入了XGBoost算法.本文在4个模拟数据集和4个实际生存数据集上,与传统生存分析回归算法Cox比例风险模型、XGBoost算法、CoxBoost算法、随机生存森林和梯度提升树(Gradient Boosting Desicion Tree)算法进行了回归预测性能的比较,验证了本文提出的算法具有较好的预测性能.同时,本文利用了Shapley Additive Explanation values(SHAP值)的方式进行模型特征的解释分析,从而进一步说明了本文提出的算法可以有效地指导生存分析的诊断与实践.

关键词

生存分析/Cox半参数回归模型/XGBoost算法/随机生存森林

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

赵学靖

学位年度

2022

学位授予单位

兰州大学

语种

中文

中图分类号

O1
段落导航相关论文