基于深度学习的高分辨率遥感影像语义分割研究

牛子儒¹

扫码查看

作者信息

1. 郑州大学
折叠

摘要

高分辨率遥感影像的语义分割在国土规划、智慧城市等领域具有重大的应用前景。随着遥感影像分辨率及解析力的不断提升，各领域对遥感影像分割提取的精度也提出了更高的需求。然而，如何提高遥感应用中对目标边界划分的精细程度以及地物种类识别的正确率，一直是处理过程中的难点。加之遥感影像的数量规模逐渐庞大，研究领域又缺乏高效的自动化分割方法，遥感影像在各个领域的深入应用受到极大的限制。近年来，基于神经网络的深度学习方法作为解决以上问题的突破口，成为了遥感影像处理的研究热点。目前研究中主流深度学习方法没有针对高分辨率遥感影像的特点进行设计，因此对影像中不同尺度地物的提取能力以及分割结果的准确率有待进一步提高。本文针对以上问题，结合高分辨率遥感影像的特点，对现有的模型和方法进行了改进和优化，获得了更高的语义分割精度，本文的主要研究工作包括以下几个方面: (1)针对遥感影像的尺寸较大的特点，设计了合适的预处理方案。通过实验分析了影像分块大小以及块间覆盖率对分割结果的影响，选取了合适的预处理参数，有效改善了模型的分割精度。 (2)为了提升高分辨率遥感影像的分割精度，本文设计并实现了一种基于U-Net编码器-解码器结构的多尺度特征融合模型MFFU-Net。该模型可以有效解决高分辨率遥感影像中地物信息复杂、类别分布不均、尺度差距较大、边界难以区分等问题。模型首先通过多尺度跳跃连接算法以充分利用遥感影像多尺度特性，然后设计通道注意力算法处理融合后的特征图，强化关键特征的表达，最后在网络深层嵌入改进的空洞空间金字塔池化模型，并进一步融合图像的语义信息。本文选取了ISPRS发布的Vaihingen、Potsdam以及武汉大学发布的GID数据集进行实验，结果表明，改进后的算法在三个各有特点的数据集上均获得了良好的结果，F1score分别达到了90.2％、90.4％和84.3％，性能优于较为流行的通用分割网络，相较于基础网络U-Net有显著的提升。 (3)为了进一步提升图像分割效果，提升在实际工程中的应用价值，本文针对多尺度特征融合模型展开研究，提出了针对高分2号影像的分割网络MFFU-Net+。该网络首先改进了MFFU-Net中的注意力算法，使其并行地计算通道和空间维度的注意力信息，然后设计了基于像素整体映射的上采样算法，在减小信息损失的同时有效利用特征的全局信息，最后根据遥感影像的特点设计了混合损失函数，有效解决了类别不均衡问题并增强分类效果。在GID数据集的实验表明，MFFU-Net+可以有效的提升各地物的分类精度，特别是对于难分类样本的提升较大，平均F1score提高了2.3％。实验在数据集之外选取了南水北调工程中荥阳市的高分2号遥感影像，其预测结果相较于基础网络有明显提升，进一步表明模型的优良性能以及实用性。

关键词

遥感影像/语义分割/深度学习/注意力机制/卷积神经网络

引用本文复制引用

授予学位

硕士

学科专业

软件工程（工程硕士）

导师

郭恒亮

学位年度

2021

学位授予单位

郑州大学

语种

中文

中图分类号

段落导航