首页|基于多源数据的抚顺市PM2.5影响因素分析及预测

基于多源数据的抚顺市PM2.5影响因素分析及预测

杨甜

基于多源数据的抚顺市PM2.5影响因素分析及预测

杨甜1
扫码查看

作者信息

  • 1. 北京工业大学
  • 折叠

摘要

空气质量是评价城市综合实力的关键因素,同时也关系到居民的生产生活。PM2.5(FineParticulateMatter)是一项重要的空气质量评价指标,分析PM2.5浓度的影响因素并对其预测能够为生产生活提供预警信息,同时有助于政府和相关部门提出及时有效的防治措施。现有的PM2.5预测方法中,大部分模型仅考虑了目标站点的历史数据,而忽略了PM2.5的空间相关性。因此,本文围绕抚顺市24个监测站点的数据展开研究,寻找PM2.5浓度的影响因素,同时,考虑到了PM2.5浓度在研究区域上的空间相关性,探究在单站点信息与多站点信息下所建模型对目标站点PM2.5浓度的预测性能。首先,根据2020年抚顺市24个监测站点的数据描述PM2.5浓度的时空分布特征,为PM2.5浓度的预测建立基础;其次,为防止预测时的特征冗余,运用广义可加模型寻找PM2.5浓度的重要影响因素;最后,考虑PM2.5的空间相关性,构建单站点与多站点信息下的预测模型,并进行对比。 研究结果如下: (1)抚顺市的PM2.5浓度有明显的季节差异,PM2.5浓度在冬季最高、夏季最低,春、夏、秋三个季节的PM2.5浓度与冬季存在显著性差异;月度特征上,PM2.5浓度在1月达到最高,且1月份的浓度为其余月份的两倍多;小时特征上,在夜间21时至次日9时,PM2.5浓度较为稳定,约为541μg/m3,10时至20时,PM2.5浓度变化趋势呈“U”型,午后16时PM2.5浓度达到全天最低。抚顺市的PM2.5浓度具有空间自相关性,对其空间分布特征进行分析,发现中心区域的PM2.5浓度比边界区域高。 (2)广义可加模型(GeneralizedAdditiveModel,GAM)能够有效地描述各因素与PM2.5浓度之间的关系。其中,大气压与PM2.5浓度变化呈现线性关系,PM10、NO2、CO、O3、湿度、风速、风向与PM2.5浓度均呈现非线性关系。除单个因素的影响外,O3与SO2、大气压间的交互作用都在显著性水平α=0.05的条件下影响PM2.5的浓度变化。最终通过模型可视化,定量分析了单因素及交互作用对PM2.5浓度的影响效应。 (3)考虑到PM2.5浓度在研究区域上的空间自相关性,基于单站点与多站点的信息,建立随机森林回归(RandomForestRegression,RFR)模型与支持向量回归(SupportVectorRegression,SVR)模型对目标站点的PM2.5浓度预测。在预测前,运用粒子群优化算法(ParticleSwarmOptimization,PSO)与网格搜索法优化模型参数,对比发现,粒子群算法优化的模型预测性能更好且收敛速度更快。相比单站点信息,多站点信息下建立的模型误差更小,能够更准确地预测目标站点的PM2.5浓度。同时,无论在单站点信息还是多站点信息下,同一优化方法下的SVR模型的拟合优度均比RFR模型高5%左右。总结得出,预测目标站点的PM2.5浓度时,若站点数据足够,则应基于多站点信息,选取PSO-SVR模型进行预测。

关键词

PM2.5/随机森林回归/支持向量回归/广义可加模型/时空分布

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

王雪丽

学位年度

2022

学位授予单位

北京工业大学

语种

中文

中图分类号

X5
段落导航相关论文