基于深度卷积神经网络的遥感图像场景分类研究

余甜微¹

扫码查看

作者信息

1. 陕西科技大学
折叠

摘要

随着遥感卫星、成像传感器和无人机技术的持续进步，遥感图像的数量得到显著扩增，空间分辨率也不断提高。高分遥感图像呈现出更为丰富的纹理、结构特征以及清晰的场景语义信息，因此，快速有效地解译这些图像具有重要的实际意义。场景分类作为遥感图像解译工作的关键，旨在通过特征提取和标签分配对遥感场景图像自动标记为适当的类别，已广泛应用于地理图像检索、国防安全、交通监管、农作物生长分析和灾害检测等多个领域。传统的遥感图像场景分类方法大多采取人工特征提取技术，即光谱、纹理和结构特征来完成场景语义识别。但这些方法都是专家人员结合预定义算法手工设计的特征描述符，需要依赖专家的工程经验，严重制约了特征的表达能力。近几年来，利用注释数据量的跃增和视觉处理器的巨大优势，在遥感场景图像的分类任务中，深度卷积神经网络取得了出色的效果。与传统方法不同，卷积神经网络通过诸多卷积、池化层交替构成分层特征表示框架，拥有强大的建模能力。因此，本文从深度卷积神经网络入手，针对遥感图像尺度差异大、空间布局复杂且部分场景类别混淆度高的难题，提出多级别跨层双线性融合和可变形注意力协方差网络两种遥感图像场景分类算法。主要研究内容如下: (1)针对遥感场景图像地物信息复杂，模型分类性能弱的问题，设计了一种基于多级别跨层双线性融合的场景分类方法。由于卷积神经网络通常采用单一尺寸的卷积核，捕获到的场景特征信息量不足。为了获取更为丰富的不同尺度下的场景语义信息，设计出多尺度膨胀卷积模块，以经典深度残差网络作为特征提取器，在获取到多层次的深度特征基础上，串行融合由不同扩张率的膨胀卷积提取到的多空间尺度信息，对深度特征进行语义增强。为增强模型的特征提取能力，设计出多级别注意力特征融合模块，利用空间注意力机制滤除低层特征中无用的背景细节，再通过阶段级融合递进的方式实现低层、高层和全局上下文信息互补。最后，提出跨层双线性融合方法对多级别特征执行哈达玛积运算进行分层融合，捕获同一网络不同层级间成对的二阶特征关系，提高融合特征的区分性。 (2)针对传统卷积神经网络无法自适应场景目标的几何变化，模型表征能力不足的问题，设计了一种基于可变形注意力协方差网络的场景分类方法。为促进模型对场景目标几何形变的适应性，结合可变形卷积与坐标注意力，对原始三层残差块进行改进，提出了可变形注意力残差块，使网络结合地物形态对采样点达到动态调整的同时，可以捕获到图像上远程空间交互信息及坐标信息。为了进一步提升分类性能，设计了基于均衡重组的协方差矩阵融合方法。首先通过均衡重组方式保证了不同层次特征在融合时的信息平等性，再通过协方差矩阵融合方式充分挖掘到不同层次不同通道维度间信息的相关性，显著加强了场景分类的准确性。 (3)为了评估本文所提出的两种场景分类方法的可靠性，分别在常用的21类UCM数据集、AID的30类Google数据集以及大规模PatternNet数据集上设置了一系列实验。在本文的实验中，使用数据扩充生成增强的数据，以训练有效的模型。通过设置不同超参数的对比实验，挑选出使模型取得最优性能的参数。此外，本文对每个模块在该体系结构中的作用进行了详尽的分析，实验结果进一步验证了提出的分类方法的优点。最后，与多种最新的算法在三个数据集上进行准确率对比，最高总体分类准确率分别达到99.32％、96.18％和99.65％，结果表明本文的方法实现了更显著的分类精度。

关键词

场景分类/多尺度膨胀卷积/特征融合/可变形卷积/协方差矩阵

引用本文复制引用

授予学位

硕士

学科专业

控制科学与工程

导师

郑恩让

学位年度

2022

学位授予单位

陕西科技大学

语种

中文

中图分类号

段落导航