XGBoost-SHAP机器学习可解释框架用于轻度认知障碍分类研究

扫码查看

原文链接

NETL
NSTL
万方数据

中文摘要：目的利用机器学习算法对轻度认知障碍(mild cognitive impairment,MCI)亚型分类有利于患者的个性化治疗,而复杂模型常因分类过程的内部机制不可洞察而饱受诟病,本研究借助可解释技术梳理模型的输出结果,以期为相关领域研究者的决策提供统计支持.方法本研究联合极限梯度提升(eXtreme Gradient Boosting,XGBoost)与沙普利可加性(SHapley Additive exPlanations,SHAP)构建可解释性框架,用于遗忘型MCI(amnestic MCI,aMCI)和非遗忘型MCI(non-amnestic naMCI)的分类,并根据联合框架输出结果进行解读.结果联合框架输出aMCI和naMCI的最佳分界值为 0.51,XGBoost分类准确率、灵敏度、特异度、F1 值、AUC分别为 92.81%、94.94%、90.54%、0.93、0.96.SHAP个性化预测结果,7 号和 31 号示例个体被预测为aMCI的概率分别为 0.27 和0.91;全局性解释结果,不同个体随着CEREALL、O-RIENT、CDRSUM、LCMF、RSUPMAR、RMEDORBF、LPOSCENM等指标的shapley值增大,患aMCI的风险越大,上述指标可以解释为aMCI发生的危险因素,而RENT、MMSEORDA、CRAFTVRS等则相反,可以解释为aMCI发生的保护因素.结论 XGBoost-SHAP联合框架用于MCI亚型分类效果较为理想,实现了特定个体不同特征预测效果的比较、不同个体给定特征预测能力的判断,为相关研究者打开了洞察复杂模型内在机制的大门.

作者：

易付良、陈杜荣、杨慧、秦瑶、韩红娟、崔靖、白文琳、马艺菲、张荣、余红梅

展开 >

作者单位：

山西医科大学公共卫生学院卫生统计教研室(030000)

重大疾病风险评估山西省重点实验室

关键词：

机器学习可解释性极限梯度提升-沙普利可加性轻度认知障碍分类

基金：

国家自然科学基金资助项目国家自然科学基金资助项目山西省应用基础研究计划青年科学研究项目山西省研究生创新项目

项目编号：

81973154822737422021030212232422022Y367

出版年：

2024

DOI：

10.11783/j.issn.1002-3674.2024.03.019

中国卫生统计

中国卫生信息学会中国医科大学

中国卫生统计

CSTPCD北大核心

影响因子：1.172

ISSN：1002-3674

年,卷(期)：2024.41(3)

参考文献量38