摘要
积雪是冰冻圈中分布最广泛的组成要素,其高反照率和低导热性显著影响着地表与大气的相互作用。积雪的季节和年际变化特征对全球地表能量平衡、气候变化和水文过程等具有着重要意义。积雪研究中最重要的两个参数是积雪覆盖和积雪深度。相比于积雪覆盖而言,积雪深度除提供积雪空间覆盖信息外,还提供了积雪的质量信息,同时积雪深度也是积雪研究中的难点和热点。高精度的全球或半球尺度雪深产品对理解气候变化及水文研究具有至关重要的作用。本研究基于AMSR-E(Advanced Microwave Scanning Radiometer for Earth Observation System)、AMSR2 (Advanced Microwave Scanning Radiometer-2)、NHSD (long time series of daily Snow Depth over the Northern Hemisphere)、GlobSnow (Global Snow Monitoring for Climate Research)、ERA-Interim和MERRA-2 (Modem-Era Retrospective analysis for Research and Applications,Version 2)等6种格网雪深产品、地面观测雪深及辅助数据,通过比较多种机器学习方法融合精度进而选择最优的机器学习方法。利用最优机器学习方法融合制备1980~2019积雪水文年雪深数据集,并将经过验证的融合数据集用来揭示北半球雪深趋势变化规律。本研究的结论主要包含以下几个方面: (1)利用相同的训练样本和验证样本结合误差反向传播的人工神经网络(Back Propagation—Artificial Neural Network,BP-ANN)、支持向量机回归(Support Vector Machine Regression,SVMR)和随机森林回归(Random Forest Regression,RFR)等3种机器学习方法进行雪深数据融合。对比3种融合结果,RFR相比SVMR和BP-ANN而言,在所有季节和土地覆被分类条件下,具有更高的决定系数(R2)值,更小的均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)值,表明RFR方法具有较高的融合精度。从积雪季节变化来看,机器学习方法在雪深较厚的冬季和春季融合精度高于积雪较浅的秋季。从模型结构来看,RFR属于集成学习,避免了过拟合等缺陷,精度最高。BP-ANN相对于SVMR而言,其融合精度更高,这主要是与SVMR基于核的模型结构有关,更适合小样本数据,很难用于大规模训练。 (2)RFR模型在不同土地覆被类型和积雪季组合下泛化能力检验结果表明,RFR模型在同区域不同时间段的泛化能力较优,且在冬季和春季的泛化能力优于秋季,这主要由于秋季有很多训练样本的雪深值为0 cm。通过逐一删除变量进行模型稳健性检验,各个变量被逐一剔除后对模型精度影响差异较大,但当经度、纬度、海拔高程和所有雪深产品都作为输入变量时,融合结果精度最高。因此,在长时间序列雪深数据集制备工作中,分不同时间段将尽可能多的雪深产品作为输入变量进行数据融合工作。 (3)以2003~2011积雪水文年为试验段,进行时间序列雪深产品融合,发现融合雪深与地面观测雪深的R2为0.91,精度较高。在北半球主要积雪区随机选取地面观测点将AMSR-E、NHSD、GlobSnow、 ERA-Interim、MERRA-2、融合雪深与地面观测雪深在2003~2011积雪水文年进行交叉对比验证。结果表明融合雪深产品除在积雪较深的山区精度一般外,其他验证点的整体精度较优,与地面观测数据一致性较高。此外,虽然个别验证点的结果显示部分原始雪深产品的精度最高,但融合雪深数据的精度都接近精度最高的雪深产品。 (4)利用RFR分3个时间段制备了1980~2019年长时间序列逐日雪深数据集。通过融合数据与原始格网雪深产品数据的交叉对比结果来看,R2从融合前最优的0.23 (GlobSnow雪深产品)提升至0.81,RMSE由15.86 cm降低至7.69cm,MAE由6.14 cm降低至2.74 cm。利用地球系统模型-积雪模型对比计划提供的独立观测点验证融合雪深数据,结果表明:融合雪深可以较好的获取雪深变化趋势和雪深值。独立站点观测数据验证结果表明融合数据在0~100 cm雪深范围内精度较高。在下垫面环境比较均一的像元内,融合数据精度较高,而在环境异质性较高的像元内,融合数据相对于原始格网雪深产品而言精度提升不明显。 (5)在不同的海拔高度和不同雪深范围内对融合数据进行精度验证,结果表明:融合雪深在地面观测雪深较浅时(小于5 cm),出现轻微高估现象;而在雪深范围5~30 cm时,偏差较小,偏差的分布没有出现明显的高估或低估现象;从雪深超过30 cm开始,融合雪深逐渐出现低估现象。而地面观测雪深超过50cm时,低估现象更为明显,但是绝大部分低估值还是小于20 cm。融合雪深在海拔100~2000m的范围内,融合精度较高。融合雪深数据在海拔小于100m的范围内精度较低的主要原因是积雪较浅(小于5 cm),融合雪深出现高估现象;在海拔超过2000m的范围内,融合雪深精度较低的主要原因是高海拔区域,雪深相对较深且用于模型训练和优化的地面观测点数量较少,融合雪深相对于地面观测雪深而言,出现明显低估趋势。 (6)基于融合雪深的趋势变化分析显示,1980~2019年北半球整体雪深呈现出下降趋势,北美的雪深下降幅度明显大于欧亚大陆。多年平均雪深较深的区域主要分布在西西伯利亚平原、落基山脉和阿尔卑斯山脉等地。北纬40°N以南的区域大多数雪深值小于5 cm。利用Mann-Kendall (M-K)趋势分析方法来看,北半球陆地有积雪覆盖的区域,71%的区域呈现下降趋势,而29%的区域呈现出上升趋势。积雪深度显著减小的区域主要分布在加拿大的东部和北部以及瑞典、芬兰和俄罗斯的北部区域:而显著增加的区域主要分布在西伯利亚平原、东西伯利亚山地和落基山脉等区域。