摘要
创伤是一种全球性的流行病,占全球总死亡人数的9.2%,每年治疗花费超过5000亿美元,给社会带来了沉重的经济负担。及时有效的院前病情评估和分诊对于创伤患者的良好预后具有重要的意义。美国外科医师学会创伤委员会( The American College of Surgeons Committee on Trauma, ACS-COT) 指南指出,创伤分诊的目标是分诊不足率低于5%同时过度分诊率保持在35%以下。既往的研究试图开发预测模型,以协助紧急医疗服务(Emergency Medical Service, EMS)人员能够尽早进行临床病情评估和医疗分诊。然而,大多数现有的创伤分诊方案一方面来源于临床经验的总结,另一方面多基于单中心小样本数据,且采用简单的广义线性统计模型进行拟合,或是包含临床上相对难以测量的变量,因此这些模型在实际工作中运用的并不好,不足分诊和过度分诊时有发生。考虑到个体受伤情况的差异与其对死亡率的潜在协同效应之间的复杂关联,机器学习因为可以捕捉特征之间复杂、非线性关系,所以广泛应用于医疗建模中。 研究目的: 本研究旨在利用美国国家创伤数据库(National Trauma Data Bank, NTDB),开发创伤患者预后模型,以期提高检伤分类效率,为人力和医疗资源的合理配置提供理论基础。1.对NTDB中包含的变量分布情况做一介绍;2.基于机器学习算法开发严重创伤患者不良临床结局的预后模型; 3.基于机器学习生存算法开发严重创伤患者8小时和24小时生存预测模型(考虑时间因素)。 研究方法: 1.基于ICD-9, ICD-10代码识别创伤患者,并对创伤患者的总体分布规律、创伤患者亚组分布规律(创伤患者年度趋势、创伤部位分析、不同创伤机制分析、不同伤情严重程度分析、不同患者生存结局和并发症分析、不同患者多发伤情况分析)进行相应的统计分析,以全面描绘NTDB中创伤患者的基本信息。 2. 收集2017年1月1号至2018年12月31号NTDB中严重创伤患者的人口学、创伤类型、院前生命体征、院内结局等指标,运用神经网络(Neural Network,NNET)、朴素贝叶斯(Naive Bayes, NB)、Logistic 回归(Logistic Regression, LR)、梯度提升机( Gradient Boosting Machine, GBM)、自适应增强(Adaptive Boosting,Ada)、随机森林(Random Forest, RF)、袋装树( Bagging Tree, TB)、分类增强机(Categorical Boosting,CatBoost)和极度梯度提升(Extreme Gradient Boosting,XGB)这9种机器学习算法来构建严重创伤患者临床结局的预测模型。 3.收集2015年1月1号至2018年12月31号NTDB中严重创伤患者的人口学、创伤类型、院前生命体征、院内结局等指标,运用生存树(Survival Tree,ST)、随机生存森林(Random Survival Forest,RFS)、梯度提升机(GBM)和Cox比例风险等算法构建院内8小时和24小时不良结局的生存预测模型,采用C指数、区分度、校准曲线等从多维度评价模型性能。 研究结果: 1.2015年至2018年,NTDB中共计纳入3,917,656例创伤患者,其中男性3,177,141例(占比81.11%),女性739,901例(占比18.89%)男女比例约为4.29:1。从2015年到2018年,创伤人数趋势性检验p for trend<0.001。创伤患者年龄以16-49岁青壮年(占比40.73 %)、白人(占比74.36%)为主。另外,患者多入住于非营利性教学医院,且医院床位大于600张。从致伤原因看,创伤患者以交通伤(32.78%)为主;从致伤部位分析,头部(27.57%)和下肢(24.62%)是患者最容易受伤的部位。从院前指标来看,创伤患者的院前时间普遍较短,例如EMS反应时间为9.00(5.00,28.00)分钟。就院前评分而言,90.91 %的患者损伤严重程度(Injury Severity Score,ISS)评分为13-15分,84.30 %的患者格拉斯哥昏迷评分(Glasgow coma score,GCS)评分为0-16分。就院内结局而言,1.07%的患者发生急诊室内死亡,而院内死亡的比例达到3.05%。 2.针对严重创伤患者的不良结局的研究中,纳入NTDB数据库2017-2018年共计50,429例患者,其中发生不良结局的2808例,不良结局的危险因素依次为创伤类型、EMS转运时间、收缩压、氧饱和度、呼吸频率、EMS反应时间、脉搏、EMS现场时间、ISS、GCS 和年龄。NNET,NB,LR,GBM,Ada,RF,TB,CatBoost,XGB 测试集中的 AUC 分别为 0.893(0.888-0.899),0.863(0.856-0.870),0.891(0.886-0.898),0.542(0.530-0.553),0.865(0.858-0.872),0.888(0.882-0.895),0.837(0.829-0.846),0.776(0.766-0.787),0.863(0.856-0.870),其中 NNET 模型的区分度最佳,在校准度方面,NNET也表现出了良好的性能。与传统评分对比方面,NNET模型的预测性能表现更优(0.893 vs 0.747 vs 0.813)。为了便于临床使用,我们基于“Shiny”包搭建了一个在线可视化网络平台(网址:https://pcstudy.shinyapps.io/Probability_ of_adverse_outcome/)。 3.在针对严重创伤患者8小时及24小时生存率的研究中,纳入NTDB数据库2015-2018年共计191,240严重创伤患者,GCS、ISS、损伤类型、年龄、氧分压、呼吸频率、收缩压、EMS转运时间、EMS现场时间、脉搏、EMS反应时间是主要预测因素。对于预测8小时生存而言,Cox、ST、RFS和GBM的C指数分别为0.866(0.859,0.873),0.851(0.842,0.860),0.886(0.878,0.894)和 0.872(0.864,0.880)。24小时生存模型的表现类似,而RFS模型的误分率也更低。在校准度上,RFS模型表现良好。为了便于临床使用,我们基于“Shiny”包搭建了一个在线可视化网络平台(网址:https://pcstudy.shinyapps.io/survival_prediction_model/)。 研究结论: 从2015年到2018年,创伤人数呈上升趋势,多因交通伤入院,人群以青壮年白人为主;9种机器学习算法在预测严重创伤患者不良结局方面均表现良好,其中以NNET模型最佳,创伤类型、EMS转运时间、收缩压、氧饱和度、呼吸频率、EMS反应时间、脉搏、EMS现场时间、ISS、GCS和年龄可以作为预测因子,值得一提的是,且这些院前指标在临床上容易测量。对于考虑时间因素的生存模型预测而言,RFS表现最好,具有较强的临床应用价值。本研究的模型虽基于多中心大样本量的测试,但也需要进一步的临床验证。