基于深度学习的无人机和卫星跨视图地理定位方法研究

莫单琪¹

扫码查看

作者信息

1. 吉林大学
折叠

摘要

无人机和卫星跨视图地理定位方法是通过比对无人机视角和卫星视角下的图像，为无人机提供当前地理位置定位或导航至目标地理位置的技术。然而，由于无人机和卫星视角下的图像在外观、空间尺度以及环境条件等方面存在显著差异，传统的基于人工设计特征的方法难以解决此任务。同时，目前深度学习模型在特征提取和挖掘图像多元化特征方面仍有局限性。针对上述问题，本文提出了融合了多元特征的无人机和卫星跨视图地理定位模型MGeo V1。此外，为进一步提高在低空视角下无人机图像地理定位精度，本文提出了MGeo V2模型及其轻量化模型MGeo V2-X。本文的研究工作主要包括以下几个方面： (1)本文提出无人机和卫星跨视图地理定位模型MGeo V1，主要由特征提取模块和多特征分类器两部分构成。为了提高模型的特征提取能力和利用图像的细粒度特征，MGeo V1模型引入InternImage作为特征提取模块中的骨干网络，并提出了一种基于神经元能量分割的方法来提取图像的区域特征。最终，MGeo V1模型采用三个分支，分别专注于图像中的全局特征、主体目标区域特征和背景区域特征，以供后续多特征分类器模块对这些特征进行优化和拼接，实现无人机和卫星图像之间的跨视图地理定位任务。实验结果展示，在University-1652数据集上，MGeo V1模型的AP指标平均取得92.19%，与当前最优模型MCCG相比提高1.83%。在SUES-200数据集250米及以上无人机飞行高度拍摄的图像子数据集中，MGeo V1模型的AP指标比MCCG模型平均提升1.28%，而在200米及以下飞行高度子数据集中，与MCCG模型相比，MGeo V1模型的AP指标平均有3.84%的差距。 (2)为提升低空视角无人机地理定位任务的准确率，本文提出了无人机和卫星跨视图地理定位模型MGeo V2。在MGeo V2模型的特征提取模块中，本文提出了一种InternImage骨干网络多层级特征的高效利用方法，将MGeo V1模型的单一全局特征分支细化为多全局特征分支从而处理多层级特征，有效提高了MGeo V2模型利用全局特征的能力。同时，本文还提出了一种特征增强方法用于多全局特征分支，旨在强化模型在低空任务中定位目标内容区域的能力。实验结果展示，在University-1652数据集上， MGeo V2模型的AP指标平均取得93.30%准确率，与MCCG模型相比提高2.95%。在SUES-200数据集上，MGeo V2模型在所有无人机飞行高度子数据集均优于MCCG模型，特别是在200米及以下无人机飞行高度子数据集上，MGeo V2相较于MGeo V1模型，AP指标平均提升6.62%。 (3)本文提出了轻量化跨视图地理定位模型MGeo V2-X。为了满足部分计算资源受限场景的需求，本文提出了融合卷积神经网络和多维协作注意力机制的轻量级网络MogaNet-MCA ，从而替换MGeo V2模型中采用的InternImage作为MGeo V2-X模型的骨干网络。同时，为进一步减少参数量，MGeo V2-X模型去除了MGeo V2模型特征提取模块中背景区域的特征分支。实验结果展示，在University-1652数据集上，MGeo V2-X模型相较于MGeo V2模型和MCCG模型，参数量分别减少了83.60%和82.35%，AP指标分别平均下降4.69%和1.75%。在SUES-200数据集上，相比MGeo V2模型和MCCG模型，AP指标平均下降5.12%和2.84%。

关键词

跨视图地理定位/无人机图像/卫星图像/图像检索/深度学习/特征提取/注意力机制

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

王鏐璞

学位年度

2024

学位授予单位

吉林大学

语种

中文

中图分类号

段落导航