首页|基于机器学习算法的原发性高血压并发冠心病诊断模型研究

基于机器学习算法的原发性高血压并发冠心病诊断模型研究

龚军

基于机器学习算法的原发性高血压并发冠心病诊断模型研究

龚军1
扫码查看

作者信息

  • 1. 重庆医科大学
  • 折叠

摘要

目的:冠状动脉粥样硬化性心脏病是临床中最常见的一种心血管疾病,原发性高血压是冠心病发病最重要的危险因素之一。若不及时控制,则易进展为心力衰竭,心肌梗死,严重危害患者生命安全。冠心病的早期诊断有利于及时治疗和改善预后,临床常规的诊断方法包括:冠状动脉造影、心电图、心脏超声等,但这些诊断方法不适用于冠心病的便捷诊断,耗费成本较高,目前我国冠心病误诊和漏诊的情况仍比较严重。机器学习是一门新兴的人工智能学科,已被广泛应用于辅助医生做出客观的预测和判断。本研究拟从“医疗数据+机器学习”出发,为原发性高血压并发冠心病提供一种辅助诊断方法。 方法:以重庆医科大学医疗大数据平台中原发性高血压并患有冠心病和原发性高血压患者为研究对象,从平台中收集患者的一般信息、生命体征、既往史、实验室检查指标。使用单因素分析,最小绝对收缩和选择运算符(LeastAbsoluteShrinkageandSelectionOperator,LASSO),Logistic回归分析筛选差异性指标,以网格搜索算法搜寻机器学习算法最优参数,选取随机森林(RandomForest,RF)、极限梯度上升(eXtremeGradientBoosting,XGBoost)、分类与回归树(ClassificationandRegressionTrees,CART)、BP神经网络(BackPropagationNeuralNetwork,BPNN)四种机器学习算法构建分类模型。以精度(Accuracy,ACC),敏感度(Sensitivity,SEN)、特异度(Specificity,SPE)、曲线下面积(Areaunderthecurve,AUC)等一系列指标评估模型性能。 结果:选取原发性高血压并发冠心病患者2487例为研究组,原发性高血压患者3904例为对照组。研究组和对照组共纳入58项指标,单因素分析筛选出45项指标,45项指标进入LASSO回归筛选出23项指标,Logistic分析从23项指标中筛选出18项指标,将18项指标纳入4种机器学习模型,同时以Logistic模型作为对照。训练集中,RF、XGBoost、CART、BPNN、Logistic模型AUC为0.969、0.948、0.801、0.848、0.784。测试集中,RF、XGBoost、CART、BPNN、Logistic模型AUC为0.885,0.892,0.781,0.788,0.771,训练集和测试集中RF、XGBoost模型性能优于其他三种模型,XGBoost模型略优于RF模型。基于性能较好的XGBoost和RF模型开发的辅助诊断工具,能够满足辅助医生进行原发性高血压并发冠心病早期诊断的需求。 结论:通过利用医学数据加机器学习算法建立的机器学习诊断模型对原发性高血压并发冠心病有很好的辅助诊断功能,能够为原发性高血压并发冠心病的早期诊断提供一定的帮助。

关键词

原发性高血压/冠心病/随机森林/XGBoost模型/决策树

引用本文复制引用

授予学位

硕士

学科专业

临床医学;医学信息学

导师

王惠来

学位年度

2021

学位授予单位

重庆医科大学

语种

中文

中图分类号

R5
段落导航相关论文