首页|基于机器学习方法对冠心病、冠脉病变严重程度的预测研究

基于机器学习方法对冠心病、冠脉病变严重程度的预测研究

刘肃强

基于机器学习方法对冠心病、冠脉病变严重程度的预测研究

刘肃强1
扫码查看

作者信息

  • 1. 汕头大学
  • 折叠

摘要

冠心病是一种慢性心脏病,通常是由于冠状动脉粥样硬化引起的。冠心病在世界范围内是一种普遍的疾病,因其高死亡率而备受关注。目前冠心病的诊断主要依赖冠脉造影,但该方法有创且价格昂贵,很多病人难以接受。通过构建冠心病、冠脉病变严重程度预测模型,能为冠心病的防治提供支持,从而降低冠心病的死亡率。 机器学习方法可用于确定疾病主要影响因素、诊断疾病以及构建疾病风险预测模型。决策树和随机森林是常见的机器学习方法,可以自动生成判别结果,这更有助于理解规则,且不受限于样本量的大小和模型的结构是否为线性,可以很大程度上弥补了 logistics回归方法的缺陷和不足。 目的: 1.探讨冠心病、冠脉病变严重程度预测模型中影响因素的参考价值。 2.探讨决策树、随机森林以及logistics回归方法构建的冠心病、冠脉病变严重程度预测模型的效能。 方法: 对2020年9月至2022年3月期间在汕头大学医学院第一附属医院心血管内科住院的3000例患者进行回顾性收集,根据纳入以及排除标准共得到2252例患者。根据冠脉造影(CAG)结果,将患者分为冠心病组(有一支或者多支冠状动脉血管狭窄≥50%,n=1510)和非冠心病组(冠状动脉血管狭窄均<50%,n=742)作为对照组。冠心病组按照SYNTAX评分分为低危组(评分低于或等于22分,n=880)和中高危组(评分高于22分,n=630)。通过单因素分析、多因素logistics回归分析筛选变量,利用决策树、随机森林以及logistics回归方法构建冠心病、冠脉病变严重程度预测模型。 结果: 1.冠心病预测模型中,单因素分析显示,冠心病组与非冠心病组之间的性别、年龄、吸烟史、高血压、糖尿病、脉压、AST、ALT、CK、GLu、HbA1c、TC、TG、HDL-C、LDL-C、UA、Hcy、Cr、non-HDL-C、RC、TyG指数有统计学差异(p<0.05);多因素logistics回归分析,共筛选出性别、年龄、吸烟史、高血压、糖尿病、AST、HbA1c、HDL-C、non-HDL-C 9个变量。决策树算法构建冠心病预测模型中最相关的变量依次是HbA1c、AST、年龄、HDL-C、糖尿病、non-HDL-C、吸烟史、性别、高血压;随机森林算法构建冠心病预测模型中最相关的变量依次是AST、年龄、HbA1c、HDL-C、non-HDL-C、高血压、性别、糖尿病、吸烟史。3种冠心病预测模型中,除灵敏度外,随机森林模型的AUC、准确率、精确率、特异度、F1-Score均高于决策树模型、logistics回归模型。 2.冠脉病变严重程度预测模型中,单因素分析显示,冠心病低危组与中高危组之间的年龄、糖尿病、AST、ALT、CK、GLu、HbA1c、HDL-C、UA、Hcy、Cr、TyG指数有统计学差异(p<0.05);多因素logistics回归分析,共筛选出年龄、糖尿病、AST、HDL-C、Cr、TyG指数6个变量。决策树算法构建冠脉病变严重程度预测模型中最相关的变量依次是TyG指数、AST、Cr、糖尿病、年龄、HDL-C;随机森林算法构建冠脉病变严重程度预测模型中最相关的变量依次是AST、TyG指数、Cr、年龄、糖尿病、HDL-C。3种冠脉病变严重程度预测模型中,随机森林模型的AUC、准确率、精确率、灵敏度、特异度、F1-Score均高于决策树模型、logistics回归模型。 结论: 1.冠心病预测模型中,AST、年龄、HbA1c、HDL-C、non-HDL-C、高血压、性别、糖尿病、吸烟史有较大参考价值,且AST、年龄、HbA1c、HDL-C的参考价值要大于高血压、糖尿病、non-HDL-C、性别、吸烟史。 2.冠脉病变严重程度预测模型中,AST、TyG指数、Cr、年龄、糖尿病、HDL-C有较大参考价值,且AST、TyG指数、Cr的参考价值要大于年龄、糖尿病、HDL-C。 3.冠心病、冠脉病变严重程度预测模型中,随机森林构建的模型的预测效能均要优于决策树、logistics回归模型。

关键词

冠心病/冠脉病变严重程度/预测模型/机器学习

引用本文复制引用

授予学位

硕士

学科专业

内科学

导师

徐八一

学位年度

2023

学位授予单位

汕头大学

语种

中文

中图分类号

R5
段落导航相关论文