计算机技术与发展2020,Vol.30Issue(2) :143-147.

基于改进Apriori算法的肺癌致病因素研究

Research on Pathogenic Factors of Lung Cancer Based on Improved Apriori Algorithm

张润 冯云霞
计算机技术与发展2020,Vol.30Issue(2) :143-147.

基于改进Apriori算法的肺癌致病因素研究

Research on Pathogenic Factors of Lung Cancer Based on Improved Apriori Algorithm

张润 1冯云霞1
扫码查看

作者信息

  • 1. 青岛科技大学 信息科学技术学院,山东 青岛266000
  • 折叠

摘要

随着人民生活水平的不断提高,肿瘤疾病的人数在不断增多,其中肺癌是21世纪严重危害人类健康的重大疾病.面向肺癌电子病历如此庞大的数据量时,传统Apriori算法的串行计算方式需要频繁扫描数据库,会消耗巨大的内存占用量.对此,提出一种基于改进Apriori算法的肺癌风险评估因素分析的方法.运用Hadoop平台实现并行Apriori算法的优化,应用HBase文件存储系统对海量数据分布式存储以及Map Reduce框架进行分布式计算,最后给出基于Hadoop平台和MapReduce分布式计算模型的执行流程和测试结果.实验结果表明,改进算法在处理大数据及时有较好的执行效率以及良好的可扩展性,得出了肺癌的疾病模式与致病因素之间的隐匿规则,从而验证了改进后的Apriori算法对于辅助肺癌临床实验具有重要的意义.

关键词

关联规则/Apriori算法/Hadoop/肺癌

引用本文复制引用

基金项目

国家自然科学基金(61572268)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量6
参考文献量5
段落导航相关论文