计算机技术与发展2023,Vol.33Issue(4) :154-160.DOI:10.3969/j.issn.1673-629X.2023.04.023

基于随机森林的帕金森疾病诊断模型构建研究

Research on Construction of Parkinson's Disease Diagnosis Model Based on Random Forest

王小科 晏峻峰
计算机技术与发展2023,Vol.33Issue(4) :154-160.DOI:10.3969/j.issn.1673-629X.2023.04.023

基于随机森林的帕金森疾病诊断模型构建研究

Research on Construction of Parkinson's Disease Diagnosis Model Based on Random Forest

王小科 1晏峻峰1
扫码查看

作者信息

  • 1. 湖南中医药大学 信息科学与工程学院,湖南 长沙 410208
  • 折叠

摘要

近些年来,根据帕金森疾病(PD)患者的语音数据对该疾病做出诊断成为一种行之有效的疾病诊断方法.首先,针对语音数据集中存在非均衡数据和噪声样本的问题使用SVM SMOTE过采样技术,利用支持向量机分类器寻找支持向量并在此基础上合成新的样本以达到均衡数据集的目的;为了减少数据维度,降低学习难度,运用信息增益特征选择对所有特征属性计算数值并划分数据集以此来获得信息增益,根据信息增益的大小排序选取得到八个特征作为最优特征组合;最后,构建随机森林帕金森疾病诊断模型,并采用网格搜索和交叉验证相结合的方式进行参数调优,进一步优化模型,实现诊断模型准确率的进一步提高.实验结果表明,优化后模型的准确率、灵敏度和特异度均有提升,为别为 96.59%、94.81%和95.49%,且准确率均高于支持向量机、最邻近节点算法、朴素贝叶斯和决策树等决策模型.

关键词

SVM/SMOTE/信息增益/随机森林/网格搜索/交叉验证

引用本文复制引用

基金项目

2021 年湖南省教育科学研究重点项目(21A0250)

湖南中医药大学中医学一流学科开放基金(2022ZYX08)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量5
段落导航相关论文