摘要
目的: 顺铂诱导的急性肾损伤(cisplatin-induced acute kidney injury,CIA)是一项严重危害人类健康的全球性公共卫生问题,须引起重视。研究中国人群CIA的发生情况及其影响因素,建立CIA风险预测模型,并与已有的风险预测模型进行对比,将为我国CIA高危患者的识别和CIA防控提供理论依据。 方法: 本研究纳入2007年6月至2022年1月在某医院接受顺铂治疗的5032名肿瘤患者,按照3∶2比例随机将数据集分成建模组(n=3020)和验证组(n=2012),收集患者的临床资料。 1、在建模组,采用最小绝对收缩和选择算法(least absolute shringage and selection operator,LASSO)筛选特征集,并建立逻辑回归模型,同时采用随机森林的方法,构建随机森林模型。在验证组,采用灵敏度(sensitivity,SE)、特异性(specificity,SP)、准确率(accuracy,ACC)、马修斯相关系数(matthews correlation coefficient,MCC)、F1分数、特征曲线(the receiver operating curve,ROC)下面积(the area under the receiver operating characteristic curve,AUC)等指标评估模型的预测能力,决策曲线分析(decision curve analysis,DCA)、净重分类改进(net reclassification improvement,NRI)和综合判别改进(integrated discrimination improvement,ID1)指数评估模型的临床获益,最后综合上述指标选出性能最佳的模型。 2、将最佳模型、文献报道的Motwani模型在验证队列进行验证和对比,采用SE、SP、ACC、MCC、AUC来评估模型的区分度;采用DCA曲线、NRI和IDI指数评估模型的临床获益。 结果: 1、CIA在建模组和验证组的发生率分别为2.05%和2.04%。二元逻辑回归分析最终纳入年龄、eGFR、收缩压、使用环磷酰胺、使用氢氯噻嗪、使用糖肽类抗菌药、放射治疗和贫血8个独立危险因素建立了风险预测模型。在验证组中,逻辑回归模型的AUC为0.7370,SE为0.5854,SP为0.7839,ACC为0.7798,MCC为0.1252,F1为0.5393。通过随机森林算法筛选得到的8个变量则是收缩压、用药前血肌酐值、血钙离子浓度、尿酸、尿素、身体质量指数(body mass index,BMI)、白细胞和二氧化碳结合力(carbon dioxide combining power,CO2CP),并建立随机森林风险预测模型。随机森林模型的AUC为0.8360,ACC为0.8718,SE为0.6585,SP为0.8762,F1为0.5684,MCC为0.2213。随机森林模型的AUC明显高于逻辑回归模型(D=-2.0006,P值=0.0455),此外,随机森林模型的ACC、SE、SP、F1和MCC均优于逻辑回归模型。随机森林模型有更高的NRI值(NRI=0.3222,95%CI:0.1768-0.4676,P<0.001)和IDI值(IDI=0.0929,95%CI:0.0541-0.1316,P<0.001)。在临床效益方面:DCA曲线显示,随机森林模型具有最大的临床净获益。以上结果说明随机森林模型具有更好的预测性能和临床效益,最终选择随机森林模型作为CIA的风险预测模型。 2、采用验证组对Motwani模型进行验证,结果显示根据Motwani模型预测的低风险、中风险以及高风险人群的CIA发生率分别为1.71%、3.73%以及2%,并没有随着风险等级增加而增加。校准图提示预测概率与实际概率相差较大,校准度不佳。在验证组中,随机森林模型的AUC为0.8360,明显高于Motwani模型的0.5770,且经DeLong''stest,差异具有统计学意义(D=-2.0006,P值=0.0455),此外,随机森林模型的ACC、SE、SP、F1和MCC均优于Motwani模型,随机森林模型有更高的NRI值(NRI=0.3146,95%CI:0.1692-0.4599,P<0.001)和IDI值(IDI=0.1097,95%CI:0.0685-0.1509,P<0.001)。DCA曲线结果提示随机森林模型相较于Motwani模型有更大的临床获益。 结论: 本研究基于收缩压、用药前血肌酐值、血钙离子浓度、尿酸、尿素、BMI、白细胞计数和CO2CP,建立了性能优良的随机森林风险预测模型,且优于已发表的Motwani模型。