首页|基于电子病历挖掘的心脑血管疾病预测研究

基于电子病历挖掘的心脑血管疾病预测研究

牛玉婷

基于电子病历挖掘的心脑血管疾病预测研究

牛玉婷1
扫码查看

作者信息

  • 1. 郑州大学
  • 折叠

摘要

随着互联网技术的快速发展,医疗信息化与智能化成为一个主流发展趋势。电子病历(EMR)作为医疗信息的重要载体,解决了传统纸质病历书写混乱、不易于传输和保存的问题,成为重要的临床数据资源。目前各大医院都积累了大量的电子病历数据,如何利用数据挖掘技术对相关医疗病历数据进行分析处理,发掘病历数据中的潜在价值具有重要的研究意义。本文以心脑血管病历为研究对象,针对现有的电子病历挖掘研究中存在的病历数据利用不充分、风险因子考虑较少、预测结果单一等问题,提出了两个新的疾病预测模型,并在理论上取得了一定的进展。本文的主要研究内容和成果如下: (1)提出了基于SVM的多视角分类预测模型。通过对电子病历分析可知,病历中不仅存在结构化的病历数据,同时也存在文本数据特征,这些文本数据特征也是影响疾病预测的重要因素。为了更好的利用两方面数据,本文采用多视角分类方法进行疾病预测。此外,为了减少病历数据中冗余和弱相关特征对预测模型的影响,对现有的多视角分类模型进行改进,将特征选择和预测分类统一到一个学习范式中,提出了具有特征选择的多视角支持向量机分类模型(MSVMCFS)。实验采用检查检验数据特征和文本数据特征作为两个视角训练预测模型,并且与其他模型对比,结果表明该模型的预测准确率最好,具有很好的适用性。 (2)提出了基于集成学习的组合多标签分类预测模型。心脑血管疾病是一种多并发性疾病,尤其是对中老年患者,病人在患有脑梗死的同时有高血压、糖尿病等并发症。现有的疾病预测模型主要是针对于单一疾病进行预测,而没有考虑到疾病的并发症预测问题。因此,本文采用多标签学习算法对疾病进行联合预测。为了提高模型的预测准确率和稳定性,对现有的多标签模型进行改进,提出了基于Bagging的组合多标签分类模型(BCMC)。首先通过Bagging算法对分类器链法、标签幂集法、排序支持向量机三个算法进行初次集成,在此基础上对初次集成后的算法结果进行投票表决获得最终的预测结果。实验结果表明,与传统的多标签模型相比,通过二次集成的多标签预测模型,不仅提高了预测准确度,而且模型的性能更加稳定。

关键词

心脑血管疾病/预测模型/电子病历/数据挖掘

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

田英杰

学位年度

2020

学位授予单位

郑州大学

语种

中文

中图分类号

R5
段落导航相关论文