基于深度学习的喀斯特石漠化地区裸岩信息提取研究

吴永俊¹

扫码查看

作者信息

1. 贵州大学
折叠

摘要

石漠化是喀斯特地区土地退化的极端形式，有地球“癌症”之称，严重威胁生态安全、影响农业生产，甚至危及人类生存。石漠化治理已成为生态文明建设中亟待解决的重要问题之一。开展精准石漠化调查是石漠化治理的重要前提，而裸岩率是评价石漠化等级的重要指标，如何精准提取裸岩信息至关重要。目前，提取裸岩信息主要包括遥感和地面调查。遥感技术可以获取大范围的地表信息，但提取精细的裸岩信息效果欠佳，需要较高分辨率的影像以及地面调查的手段配合，现已有研究使用高分辨率无人机影像提取裸岩信息，但主要基于传统的图像处理方法，提取精度仍然有限；地面调查可获得更为准确的信息，但存在耗时费力、成本高、山区调查难度大等问题。针对上述问题，本文采用喀斯特石漠化地区的 RGB 三通道高分辨率航摄影像制作裸岩数据集，基于深度学习的理论和算法，构建语义分割模型用于提取多场景下的裸岩信息，并在自建数据集上与常见的语义分割模型进行对比试验分析，验证了本文构建模型的优越性，实现了较高精度的喀斯特石漠化地区裸岩信息提取。主要工作如下：（1）针对目前裸岩提取数据集缺失的问题，构建了以喀斯特石漠化地区裸岩目标作为语义标签的数据集。首先使用 RGB 三波段的高分辨影像通过人工勾绘的方式制作标签，其次对数据进行增广操作，最终得到2000张标签图像，并应用于后续的研究。（2）针对传统提取方法无法充分提取影像深层语义特征，对裸岩提取效果较差的问题，采用深度学习的方法进行裸岩提取，构建了CAFM3-DeepLabV3+模型。该模型在DeepLabV3+模型的基础上进行优化，DeepLabV3+引入的空洞空间金字塔池化模块能有效地获取不同尺度的目标信息， CAFM3-DeepLabV3+模型使用改进的轻量化MobileNetV3 作为特征提取网络，并结合特征金字塔、注意力机制加强特征提取效果。实验结果表明：CAFM3-DeepLabV3+模型在参数量仅为原始DeepLabV3+模型1/13的情况下，模型的交并比、F1-score分别达到72.46%、84.03%，高出原始模型4.62%、3.19%，并优于其余常用模型。（3）针对改进的CAFM3-DeepLabV3+模型对于裸岩颜色相似的地物识别能力较弱、复杂区域存在漏提、提取精度低等问题，构建了CRCU-Net模型。该模型在U-Net模型的基础上进行优化，CRCU-Net模型使用网络层次更深的ResNet101作为特征提取网络，弥补了原始U-Net网络对于复杂背景影像特征表达不够精确的缺陷；并通过注意力机制获取特征图通道间的关系及空间位置信息；最后在解码器中采用内容感知特征重组上采样算子对特征进行特征恢复，有效地利用了特征图的语义信息。实验结果表明：CRCU-Net 模型提高了与裸岩目标相似度较高的目标识别能力，误提现象得到很大改善，分割精度得到进一步提高；模型的交并比、F1-score分别达到74.11%、85.13%；高出原始U-Net模型3.64%、2.45%，CAFM3-DeepLabV3+模型1.65%、1.1%。（4）针对基于卷积的语义分割模型在获取长依赖信息能力较弱，复杂条件下分割精度不够高等问题，构建了ViT-CRCU-Net模型。该模型结合了卷积神经网络和Vision Transformer，较好地融合了两者的优势，ViT-CRCU-Net 使用基于卷积的 CRCU-Net 作为模型主体，用于获取图像局部细节特征及高级语义信息；在其末端添加 Vision Transformer 模块以捕捉全局特征和长依赖信息。此外，在模型训练时，使用的 CRCU-Net 权重作为预训练权重并采用冻结训练的方式对模型进行训练。实验结果表明：这种训练策略提升了模型训练效率和精度，ViT-CRCU-Net 在复杂背景及含有较强干扰目标的场景下分割效果最好，实现了对裸岩更精准地分割；模型的交并比、F1-score在CRCU-Net模型的基础上提高了1.04%、0.68%。

关键词

喀斯特石漠化地区/航摄影像/裸岩信息提取/语义分割/深度学习

引用本文复制引用

授予学位

硕士

学科专业

测绘科学与技术

导师

汪泓

学位年度

2023

学位授予单位

贵州大学

语种

中文

中图分类号

段落导航