查看更多>>摘要:目的 通过对 2 型糖尿病合并高血压的相关因素分析,构建预测模型.方法 选取 475 例 2 型糖尿病合并高血压患者为病例组,以同期体检中心 505 例健康人群为对照组.将最小绝对值收缩和选择算子(LASSO)回归筛选出的特征变量作为随机森林(RF)、极端梯度提升(XGBoost)和逻辑回归(logistic regression)的输入,利用贝叶斯优化方法和交叉验证迭代训练获得最佳的预测模型,最后利用特征重要性排序和Shapley加性解释(SHAP)进行解释分析.结果 特征选择结果显示尿糖(GLU)(OR=1.189,95%CI=1.170~1.208,P<0.05)、糖尿病遗传史(OR=1.341,95%CI=1.273~1.411,P<0.05)、年龄(OR=1.006,95%CI=1.004~1.009,P<0.05)、身体质量指数(BMI)(OR=1.017,95%CI=1.010~1.023,P<0.05)、心率(HR)(OR=1.004,95%CI=1.003~1.006,P<0.05)、文化程度(OR=0.954,95%CI=0.934~0.975,P<0.05)、居住地(OR=0.958,95%CI=0.931~0.985,P<0.05)为主要的特征变量.算法实验结果表明,经过参数调优后RF和XGBoost模型性能均优于逻辑回归模型,XGBoost准确率 92.85%略高于RF准确率 92.34%.特征重要性结果显示,2 型糖尿病合并高血压的影响因素重要性排序依次为GLU、糖尿病遗传史、文化程度、居住地、年龄、BMI、HR,其中,GLU、糖尿病遗传史、年龄、BMI、HR为危险因素,文化程度、居住地为保护因素.结论 基于XGBoost的 2 型糖尿病合并高血压预测模型具有更好的性能,通过利用SHAP模型增强模型的可解释性,能够识别出患病的危险因素,为2型糖尿病合并高血压的预防提供参考.