摘要
目的 利用机器学习算法对轻度认知障碍(mild cognitive impairment,MCI)亚型分类有利于患者的个性化治疗,而复杂模型常因分类过程的内部机制不可洞察而饱受诟病,本研究借助可解释技术梳理模型的输出结果,以期为相关领域研究者的决策提供统计支持.方法 本研究联合极限梯度提升(eXtreme Gradient Boosting,XGBoost)与沙普利可加性(SHapley Additive exPlanations,SHAP)构建可解释性框架,用于遗忘型MCI(amnestic MCI,aMCI)和非遗忘型MCI(non-amnestic naMCI)的分类,并根据联合框架输出结果进行解读.结果 联合框架输出aMCI和naMCI的最佳分界值为 0.51,XGBoost分类准确率、灵敏度、特异度、F1 值、AUC分别为 92.81%、94.94%、90.54%、0.93、0.96.SHAP个性化预测结果,7 号和 31 号示例个体被预测为aMCI的概率分别为 0.27 和0.91;全局性解释结果,不同个体随着CEREALL、O-RIENT、CDRSUM、LCMF、RSUPMAR、RMEDORBF、LPOSCENM等指标的shapley值增大,患aMCI的风险越大,上述指标可以解释为aMCI发生的危险因素,而RENT、MMSEORDA、CRAFTVRS等则相反,可以解释为aMCI发生的保护因素.结论 XGBoost-SHAP联合框架用于MCI亚型分类效果较为理想,实现了特定个体不同特征预测效果的比较、不同个体给定特征预测能力的判断,为相关研究者打开了洞察复杂模型内在机制的大门.
基金项目
国家自然科学基金资助项目(81973154)
国家自然科学基金资助项目(82273742)
山西省应用基础研究计划青年科学研究项目(202103021223242)
山西省研究生创新项目(2022Y367)