首页|基于机器学习构建2型糖尿病左室舒张功能障碍的预测模型

基于机器学习构建2型糖尿病左室舒张功能障碍的预测模型

刘薇

基于机器学习构建2型糖尿病左室舒张功能障碍的预测模型

刘薇1
扫码查看

作者信息

  • 1. 西安医学院
  • 折叠

摘要

目的: 糖尿病心血管疾病是2型糖尿病患者死亡的最主要原因,而左室舒张功能障碍被认为是糖尿病心功能障碍最早期的心肌病理学改变,与糖尿病微血管病变相关。本研究基于机器学习构建2型糖尿病左室舒张功能障碍的预测模型,并探讨影响糖尿病左室舒张功能障碍的关键因素,以期在心脏发生不可逆损伤之前精准预测高危人群,为早期干预提供依据。 方法: 通过文献回顾法和专家咨询法确定影响2型糖尿病左室舒张功能障碍的危险因素,依照纳排标准收集2021年至2022年于陕西省人民医院内分泌科住院的2型糖尿病患者的生化指标和基本资料。使用Python语言对数据集进行数据预处理后开始进行建模。将805例样本随机均分为6份,其中5份用于5折交叉检验及调参,保留1份用于最终模型的验证。由于建模时考虑到与糖尿病直接相关的因素可能会影响模型效果,数据被分为所有特征(包含糖尿病直接相关的指标)和显著特征(不包含糖尿病直接相关的指标)两组,并对其进行对比。首先通过逻辑回归、随机森林和支持向量机三种方法针对训练集进行5折交叉检验作为模型预测能力的参考值。考虑到样本的阳性和阴性存在分布不均的情况,因此后续建模中采用调整样本权重的方法解决。然后构建5种结构逐渐复杂的神经网络模型,测试出最优的网络架构,并在最优网络架构的基础上微调以获得预测效果最佳的预测模型,最后利用验证集数据对模型进行验证。参考类别特定显著性图获取1000名虚拟的被模型认为极有可能是阳性的病人以及1000名阴性的病人,基于最优模型探讨影响2型糖尿病左室舒张功能障碍的重要因素。 结果: 首先使用逻辑回归、随机森林和支持向量机三种方法针对训练集进行5折交叉检验,作为模型预测能力的参考值。研究结果发现,在Logit模型中,所有特征的AUC值在0.697-0.820之间,显著特征的AUC值在0.687-0.803之间。在随机森林中,所有特征的AUC值在0.626-0.724之间,显著特征的AUC值在0.572-0.729之间。在支持向量机中,所有特征的AUC值在0.696-0.770之间,显著特征的AUC值在0.676-0.742之间,综合评估发现三种模型中Logit模型的总体预测性能是最优的。在构建的5种网络层数逐渐增加的神经网络模型中发现隐含层为2层时的模型预测效果最佳,且通过调整样本权重后特异度由原始的0.23-0.51上升至0.56-0.72,灵敏度由原始的0.91-0.96降至0.59-0.71。后在2层神经网络基础上测试神经元数对模型效果的影响,发现当神经元为256时得到的预测模型效果最佳,并且所有特征优于显著特征,因此采纳为最终的模型架构。神经网络的准确率、精准率、特异度、灵敏度和AUC值分别为73%、84%、64%、77%和0.752。综合评估神经网络具有良好的预测性能。基于最终模型发现被99%预测为阳性患者的指标重要性排序为DPPIV、SEX、WHR…,被99%预测为阴性患者的指标重要性排序为DPPIV、HBA1c、WHR…。 结论: 1.本研究发现基于神经网络构建的2型糖尿病患者左室舒张功能障碍发生风险的预测模型综合预测效果最佳。 2.发现是否使用DPP-IV抑制剂、性别、腰臀比和糖化血红蛋白是与T2DM患者左室舒张功能障碍发生风险相关;且使用DPP-IV抑制剂、女性、腰臀比越高发生风险越高,糖化血红高蛋白越高发生风险越低。

关键词

2型糖尿病/机器学习/神经网络/左室舒张功能障碍/预测模型

引用本文复制引用

授予学位

硕士

学科专业

全科医学

导师

李雪萍

学位年度

2023

学位授予单位

西安医学院

语种

中文

中图分类号

R5
段落导航相关论文