首页|基于多机器学习模型的逐小时PM2.5浓度预测对比

基于多机器学习模型的逐小时PM2.5浓度预测对比

扫码查看
[目的]比较分析XGBoost模型、LightGBM模型、随机森林模型(RF)、K最近邻模型(KNN)、长短期记忆神经网络(LSTM)、决策树模型(DT)共6个PM2.5浓度预测模型,以准确、及时预测环境PM2.5浓度.[方法]基于重庆市合川区2020年全年空气质量监测数据和气象数据,通过最大相关最小冗余算法(MRMR)进行数据降维选择最优特征子集,作为模型的输入,逐一进行PM2.5浓度预测;考虑到不同季节PM2.5浓度差异较大,故分季节预测了 PM2.5浓度;为了探究各模型预测性能,计算了各模型运行时间和内存占用,并基于PM2.5与特征变量的相关性和特征变量的重要性探讨了模型预测性能季节性差异原因.[结果]模型总体预测精度从高到低排序为XG-Boost、RF、LightGBM、LSTM、KNN、DT模型;预测性能方面,6个模型均表现为秋冬季节预测精度高于春夏季节;LightGBM模型可在保证模型精度的情况下,大幅减少模型训练时间和内存占用;特征重要性显示PM10浓度、气温和气压的重要性高,03浓度、风向和NO2浓度重要性相对较弱.[结论]采取MRMR方法进行数据降维选取的最优特征子集能较好地预测PM2.5浓度;相比较而言,XGBoost、RF、LightGBM、LSTM模型在PM2.5浓度预测上具有较优性能,其中综合性能较好的为LightGBM模型.
Comparative analysis of hourly PM2.5 prediction based on multiple machine learning models

陈建坤、牟凤云、张用川、田甜、王俊秀

展开 >

重庆交通大学智慧城市学院,重庆 400074

PM2.5预测 机器学习 最大相关最小冗余(MRMR) 气象因子

国家重点研发计划重庆市自然科学基金

2019YFB2102503cstc2019jcyj-msxmX0626

2022

南京林业大学学报(自然科学版)
南京林业大学

南京林业大学学报(自然科学版)

CSTPCDCSCD北大核心
影响因子:1.012
ISSN:1000-2006
年,卷(期):2022.46(5)
  • 6
  • 12