首页|基于机器学习的土壤重金属来源精准识别和量化解析

基于机器学习的土壤重金属来源精准识别和量化解析

郑家桐

基于机器学习的土壤重金属来源精准识别和量化解析

郑家桐1
扫码查看

作者信息

  • 1. 广东工业大学
  • 折叠

摘要

精准查明重金属污染主要来源与影响范围是进行区域土壤污染防控的基础与关键。土壤重金属空间分布受多因素的综合影响,导致对土壤重金属的源汇过程、成因解析及其边际效应认识不清,无法满足区域土壤污染防治与管理的需求。本文以粤北某区域为研究区,通过统计分析、源解析、空间分析、机器学习等多种手段,分析土壤Cd、Pb、Zn、Cu、Cr和Ni污染空间分异格局,辨识土壤重金属污染源汇过程及其主要驱动因素;建立与正定因子矩阵模型(PositiveMatrixFactorization,PMF)联用的梯度提升决策树(GradientBoostingDecisionTree,GBDT)土壤污染源解析方法,明确区域土壤污染源类别、组分构成及贡献率;探讨土壤重金属源汇的空间耦合关系,分析土壤污染主控因子影响程度,以期为完善土壤污染定量源解析方法、进行污染防治空间管制分区以及污染损益边界定责提供理论支撑。主要结论如下: (1)描述性统计分析结果表明重金属Cd、Pb、Zn、Cu和Cr的均值分别为1.60mg/kg、95.88mg/kg、164.54mg/kg、35.16mg/kg和69.09mg/kg,其最大值均不同程度超过国标风险筛选值和当地环境背景值。以国标筛选值为基准,单因子指数、内梅罗综合指数和地累积指数的评价结果表明,研究区土壤整体上存在中度污染,其中Cd污染程度最严重。 (2)对比普通克里金、随机森林、支持向量机和极端梯度提升树模型,极端梯度提升树对土壤重金属的预测精度较高,对6种重金属的解释程度从高到低依次为(验证集):Ni(RMSE=4.79mg/kg,R2=0.74)gt;Cd(RMSE=1.02mg/kg,R2=0.72)gt;Cr(RMSE=39.85mg/kg,R2=0.72)gt;Zn(RMSE=87.51mg/kg,R2=0.68)gt;Pb(RMSE74.44mg/kg,R2=0.54)gt;Cu(RMSE=13.98mg/kg,R2=0.53)。空间制图结果显示研究区土壤重金属含量较高的区域分布在北部(Cd、Pb、Cu)、北部和东南部(Zn)、北部和东部(Cr)及东北部和西北部(Ni)。XGBoost模型对环境变量的重要度分析结果显示重金属Cd、Pb、Zn和Cu受工业密度的影响显著,而Cr和Ni受土壤氧化铁影响显著,即重金属Cd、Pb、Zn和Cu污染主要受到人类活动变量的驱动,Cr和Ni元素主要被自然变量所驱动。 (3)PMF模型成功识别土壤中重金属的来源并量化其贡献,确定了三个因子(F1、F2和F3),通过GBDT模型评估了不同环境变量对土壤重金属污染的影响。F1主要受工业密度影响,F2主要受河流密度和工业密度影响,F3主要受氧化铁影响。综合分析结果表明,研究区土壤重金属污染主要来自大气沉降(F1,Pb:79.43%;Cu:38.03%)、污水灌溉(F2,Cd:79.32%)和自然源(F3,Cr:85.97%;Ni:85.50%)。

关键词

土壤重金属/污染来源/精准识别/量化解析/机器学习

引用本文复制引用

授予学位

硕士

学科专业

环境工程

导师

肖荣波

学位年度

2023

学位授予单位

广东工业大学

语种

中文

中图分类号

X5
段落导航相关论文