信息技术与信息化2024,Issue(2) :67-70.DOI:10.3969/j.issn.1672-9528.2024.02.015

改进随机森林算法在Spark+Kudu平台的并行化运用

庄巧蕙
信息技术与信息化2024,Issue(2) :67-70.DOI:10.3969/j.issn.1672-9528.2024.02.015

改进随机森林算法在Spark+Kudu平台的并行化运用

庄巧蕙1
扫码查看

作者信息

  • 1. 闽南理工学院 福建石狮 362700
  • 折叠

摘要

多种因素可能对学生成绩造成影响,利用数据挖掘工具对学生的学习课程成绩进行预测分析,进而利用预测分析结果及时指正学生出现的不良学习行为,同时检查老师的教学效果.首先将改进随机森林算法在大数据平台上进行并行化改进后进行实践.然后通过将提出的改进随机森林算法进行并行化,将其运用到Spark+Kudu大数据平台上进行仿真实验.最后算法并行化主要根据随机森林算法中的决策树划分策略以及模拟退火算法构建多种群策略来进行.实验结果证明并行化策略能够有效提升数据集的分类效率,大幅度缩短算法执行时间.

关键词

随机森林算法/Spark/Kudu/决策树/模拟退火算法

引用本文复制引用

出版年

2024
信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
参考文献量10
段落导航相关论文