首页|基于RWD的肺癌患者无进展生存情况预测研究

基于RWD的肺癌患者无进展生存情况预测研究

欧阳生珀

基于RWD的肺癌患者无进展生存情况预测研究

欧阳生珀1
扫码查看

作者信息

  • 1. 电子科技大学
  • 折叠

摘要

目的:根据癌症死亡人数排名显示,肺癌位居我国癌症死亡原因首位。相关研究表明,肺癌是一种在发病早期就可出现转移的恶性肿瘤,多数肺癌患者确诊时已属相对晚期,疾病的进展是导致肺癌患者死亡的主要原因。针对肺癌患者的预后建立本地化的预测模型有助于给予肺癌患者精准的评估,从而制定相应的个体化管理方案。由于影像资料难以获取等原因,目前,针对肺癌患者预后的预测模型多集中于肺癌的总生存期预测,而肺癌疾病进展相关的预测模型则比较缺乏。因此本研究尝试通过获取本地肺癌患者的真实世界数据(RWD)并进行影像资料的评价和整理,通过机器学习的方法,开展肺癌无进展生存情况预测研究的方法学探索。 方法:首先本研究从医院信息系统中提取了2015年1月至2018年12月间的肺癌住院患者相关数据,经过一系列数据预处理过程建立了标准化规范化的数据集。其次从分类预测模型的角度,采用机器学习算法建立了肺癌6个月疾病进展模型,并对模型的性能进行评价。然后,从生存分析模型的角度,采用机器学习算法建立了肺癌患者无进展生存期预测模型并且进行模型性能评价。最后通过机器学习算法筛选出影响肺癌无进展生存期的主要因素并进行分析讨论。 结果:一共有912例肺癌患者纳入本研究,经过数据整理获得了肺癌患者相关影像资料,也获得包括肺癌患者人口学特征、肿瘤学特征、共病、常规血液检测指标在内的30个变量。然后建立了肺癌6个月疾病进展模型,将数据通过变量选择和机器学习算法进行建模后一共获得16种机器学习模型,其中性能表现最好的是基于Lasso的逻辑回归模型(AUC=0.713)。接下来,采用生存分析模型算法建立了肺癌无进展生存期预测模型,基于弹性网络的惩罚COX模型(C指数=0.664,平均AUC=0.725)性能稍优于随机生存森林模型(C指数=0.649,平均AUC=0.700)。通过生存分析模型,我们筛选出影响肺癌患者无进展生存期的主要因素有:TNM分期、血小板计数、淋巴结转移、淋巴细胞率等。 结论:采用机器学习算法对于肺癌患者无进展生存情况进行预测是可行的,所建立的预测模型有良好的性能。通过分别建立分类预测模型和生存分析模型,本研究系统地开展了无进展生存数据分析和预测相关的方法学探索。研究结果将有助于对肺癌人群进行预后评估,为患者合理用药及相关干预措施制定提供参考。

关键词

肺癌/无进展生存期/预测模型/真实世界数据

引用本文复制引用

授予学位

硕士

学科专业

药学

导师

童荣生

学位年度

2022

学位授予单位

电子科技大学

语种

中文

中图分类号

R73
段落导航相关论文