摘要
目的:临床预测模型是近年来预防疾病发生、发展的良好工具,其有效提高了临床干预的预见性和主动性,而不同疾病的不同临床预测模型效果不一。本研究拟建立2型糖尿病合并周围神经病变的Logistic回归模型、决策树模型和基于Lasso-logistic回归的列线图模型临床预测模型,评价对比上述三种模型的预测效能,以便筛选出最适合2型糖尿病合并周围神经病变的预测模型,为临床早期干预提供有效指导。 方法: 1.病例收集:收集山东省德州市临邑县中医院2020年~2022年期间343例经临床诊断为T2DM的患者纳入研究,收集患者的一般资料、临床症状体征、实验室指标等指标。 2.数据录入:将收集到的病历资料进行筛选,并整理录入Excel表格后导入SPSS20.0软件。 3.建模变量指标的筛选:初步对研究指标进行探究,根据患者是否合并有周围神经病变进行分组,通过组间对比筛选出影响2型糖尿病患者合并周围神经病变的独立危险因素,选取有意义的指标作为后续建模指标。 4.建立数学模型:将筛选出的指标(Plt;0.05)制成数据表,随机抽取70%的患者(240例)作为训练集,使用SPSS构建Logistic回归模型和决策树模型,将剩余的30%患者(103例)作为测试组,用于测试模型效能诊断性能。同时,将筛选出的单因素分析有意义的数据表整理成Excel表格后,录入RStudio软件中,首先加载“glmnt”、“Matrix”、“foreach”包后构建Lasso-logistic回归模型,随后加载Norgram包、rms包、运行代码构建可视化列线图模型。 5.模型评估:分别计算各个模型的预测灵敏度和预测特异度,同时绘制各个模型的受试者工作特征曲线(ROC)曲线评估各个模型的诊断效能。 结果: 1.研究对象一般资料对比 DPN组(n=98)与对照组(n=142)的性别和BMI指数无统计学差异(Pgt;0.05),年龄、病程及合并视网膜病变情况均存在统计学差异(Plt;0.05);验模组患者103例,其中DPN组40例,建模组(n=240)与验模组(n=103)患者的性别、年龄、病程、BMI指数及合并视网膜病变情况对比均无统计学差异(Pgt;0.05)。 2.研究对象实验室相关指标比较 DPN组与对照组空腹血糖水平、2h餐后血糖水平、白细胞计数、嗜酸性粒细胞、淋巴细胞、TC、TG、ApoA1、ApoB对比无统计学差异(Pgt;0.05),但DPN组患者的糖化血红蛋白水平、hs-CRP、LDL-C、SUA均明显高于对照组(Plt;0.05),HDL-C水平明显低于对照组(Plt;0.05);建模组(n=240)与验模组(n=103)患者的血糖指标(空腹血糖水平、2h餐后血糖水平、糖化血红蛋白水平)、炎症指标(白细胞计数、嗜酸性粒细胞、淋巴细胞、hs-CRP)、血脂指标(TC、TG、ApoA1、ApoB、HDL-C、LDL-C)及血尿酸水平对比均无统计学差异(Pgt;0.05)。 3.从一般资料、炎症指标、血糖指标、血脂指标、尿酸指标中筛选出有统计学意义(Plt;0.05)且无线性相关的8个因素(合并视网膜病变、年龄、病程、HbAlc、HDL-C、LDL-C、hs-CRP、SUA)为变量进行二元Logistic多因素回归分析,多因素结果分析显示结果显示年龄、病程、HbAlc、LDL-C是DPN的独立危险因素,模型表达式为:logit(P)=14.164-1.414*年龄-6.245*病程-0.988HbAlc+3.152LDL-C。 4.决策树模型以T2DM合并DPN为因变量,将从一般资料、炎症指标、血糖指标、血脂指标、尿酸指标中筛选出有统计学意义(Plt;0.05)且无线性相关的8个因素(合并视网膜病变、年龄、病程、HbAlc、HDL-C、LDL-C、hs-CRP、SUA)作为自变量纳入模型分析,使用CRT算法及交叉验证,节点改进显著水平设置为0.001。最终结果显示,决策树模型共分为3层,共12个节点,筛选出3个解释变量,分别为病程、LDL-C和年龄。 5.使用R语言构建的Nomogram预测模型参数来自于Lasso-logistic回归模型,Lasso-logistic回归模型结果显示年龄、病程、HbAlc、LDL-C及HDL-C是DPN的独立危险因素,并基于此绘制列线图模型。Nomogram列线图模型每个因素的不同状态对应于分数表上特定分数,通过将模型中所有因素的分值计算出个人的总分,可以很容易的得出总分所对应的DPN风险概率。 6.模型组中Logistics预测模型、决策树预测模型、列线图模型的ROC曲线下面积分别为0.89、0.92和0.90,提示预测模型准确性均较高,其中决策树预测模型的效能最佳。同时,验证组中Logistics预测模型、决策树预测模型、列线图模型的ROC曲线下面积分别为0.88、0.93和0.89,模型稳定性均较理想,而列线图模型的可视化效果最佳,更便于理解。 结论: 1.合并视网膜病变、年龄、病程、HbAlc、hs-CRP、HDL-C、LDL-C、SUA与DPN的发生、发展密切相关。 2.年龄、病程、HbAlc、LDL-C是DPN的独立危险因素。 3.Logistic模型、决策树模型和列线图模型中决策树模型的预测DPN的效能相对较好,而基于Lasso-logistic回归的列线图模型更加直观,便利理解,采纳各模型的优势可在DPN初期预防管理方面为临床提供有效的参考依据。