摘要
目的: 探讨2型糖尿病(T2DM)发生糖尿病肾病(DN)的危险因素,并基于机器学习(ML)算法构建和验证相应的风险预测模型。 方法: 收集2022年08月至2023年05月期间承德市中心医院内分泌科住院治疗的581例T2DM患者的临床资料,随机分为训练集(407例,70%)和验证集(174例,30%),训练集依据是否合并DN分为DN组(94例,23.1%)和非DN组(313例,76.9%)。单因素分析训练集患者的临床资料,将其中有意义的变量通过多因素Logistic回归筛选出DN发生风险的预测因子。经K重交叉验证(K=3)建立Logistic回归(LR)、K近邻(KNN)、决策树(DT)、随机森林(RF)、朴素贝叶斯(NB)、人工神经网络(ANN)、极致梯度提升(XGBoost)、支持向量机(SVM)等8种ML预测模型。经Delong检验对模型在训练集及验证集中的受试者工作特征(ROC)曲线下面积(AUC)进行比较,挑出最佳预测模型。以列线图的方法可视化展现模型;在训练集及验证集中,绘制校准曲线衡量模型的校准性能;决策曲线(DCA)联合临床影响曲线(CIC)以衡量模型的实用性。 结果: 冠心病(CHD)病史、DM病程、乳酸脱氢酶(LDH)、胱抑素C(C ys-C)、25-羟维生素D [25(OH)D]、中性粒细胞(Neu)、甘油三酯-葡萄糖指数(TyG)是DN的风险因子。8种ML模型中,LR模型表现最佳。在训练集中,该预测模型预测值和实际值的一致性较好(MAE=0.01 3),在验证集中,该预测模型拟合效果良好(P=0.138)。综合DCA曲线和CIC曲线,当预测模型的预测概率值大于0.40时具有一定的临床实用性。 结论: 既往有CHD病史、DM病程较长、LDH、Cys-C、Neu、TyG水平升高、25(OH)D降低是T2DM患者发生DN的风险因子。该模型具有较好的预测能力和校准能力,并且临床实用性良好,有助于早期识别DN的高危患者。