计算机时代2023,Issue(5) :15-19.DOI:10.16644/j.cnki.cn33-1094/tp.2023.05.004

基于随机森林和梯度提升决策树的高血压分析预测

Analyze and predict the risk factors of hypertension based on the Random Forest and Gradient Boosting Decision Tree

沈赛拉 钟锋 梁兴 陈思悦 沈诗钰 陈璐静
计算机时代2023,Issue(5) :15-19.DOI:10.16644/j.cnki.cn33-1094/tp.2023.05.004

基于随机森林和梯度提升决策树的高血压分析预测

Analyze and predict the risk factors of hypertension based on the Random Forest and Gradient Boosting Decision Tree

沈赛拉 1钟锋 1梁兴 2陈思悦 1沈诗钰 1陈璐静1
扫码查看

作者信息

  • 1. 浙江外国语学院国际商学院计算机科学与技术系,浙江 杭州 310023
  • 2. 乐荐健康科技集团有限公司
  • 折叠

摘要

为进行高血压的危险因素分析与预测,提出一种基于随机森林和梯度提升决策树的模型.首先基于体检报告数据进行缺失值处理、one-hot编码、归一化、数据初步聚类等预处理;然后针对数据样本不均衡的特性,利用SOMTE算法进行重采样,基于随机森林得到特征重要性评分并进行特征选择;最后基于排名前20的特征值,利用梯度提升决策树算法产生预测模型.模型分析结果显示了高血压的危险性因素.经数据集交叉验证,模型准确率可以达到84.51%,具有较高的应用价值.

关键词

慢性病/高血压/随机森林/梯度提升决策树

引用本文复制引用

基金项目

2020年浙江省教育厅一般科研项目(Y202045445)

2019年度博达青年教师科研提升专项()

2020年国家级大学生创新创业训练计划(202014275007)

2020浙江省新苗计划(2020R418009)

出版年

2023
计算机时代
浙江省计算技术研究所 浙江省计算机学会

计算机时代

影响因子:0.411
ISSN:1006-8228
参考文献量7
段落导航相关论文