首页|基于三维重建应用场景下的无人机图像去模糊算法的研究

基于三维重建应用场景下的无人机图像去模糊算法的研究

王馨

基于三维重建应用场景下的无人机图像去模糊算法的研究

王馨1
扫码查看

作者信息

  • 1. 天津理工大学
  • 折叠

摘要

大规模场景的城市三维重建在城市建设等领域具有广泛的应用前景,但图像在采集过程中不可避免的会受到环境因素、相机抖动等影响导致图像发生退化现象,进而影响重建后的建筑模型,因此模糊图像的恢复对于三维重建效果至关重要,同时模糊图像增强也是计算机视觉领域的一项重要的研究课题。传统去模糊方法通常需要对模糊核进行估计,通过大量图像先验人工设计特征模型,但往往不具有泛化性,复原图像仍存在振铃效应以及噪声等。基于深度学习的去模糊算法当前主要问题在于对于数据集依赖程度较高,但数据集合成方法有限,并且存在复原图像的很多细节信息不完善以及图像边缘模糊等问题。 针对难以采集到满足条件的数据集这一问题,本文结合城市三维重建背景,提出了一种基于深度学习的三级模糊图像数据集扩充方法,从而实现了模糊图像数据集的扩展。此外针对复原图像细节丢失问题,构建基于残差注意力机制的生成对抗网络结构,改善了图像中诸多细节以及建筑边框纹理上的恢复。本文就这两个关键问题进行的研究工作如下: (1)提出一种基于深度学习的三级模糊图像数据集扩充方法。首先对无人机图像采集过程中可能受到的模糊干扰进行分析,最终确定不可避免会发生的三种模糊,即运动模糊、大气湍流模糊和由于外界因素产生的散焦模糊,然后对真实拍摄的体育馆建筑图像集分别进行三种模糊构建,将混合三种不同种类的模糊图像与原始清晰图像构成训练数据集。将生成的模型与只构建单一模糊数据集训练生成的模型进行测试,经过对比实验验证,本文提出的数据集扩充方法可以训练出更优的模型,同时可以实现更好的图像去模糊效果。 (2)提出基于残差注意力的生成对抗网络去模糊方法。针对于大部分深度学习去模糊算法存在的细节丢失以及边缘轮廓恢复不明显的现象,本文对生成对抗网络进行改进,在原有基础上添加残差注意力模块和加权残差密集块,主干网络采用特征金字塔结构提取到图像特征,其中包含由粗到细的不同层,同时添加残差注意力机制模块实现对提取到的信息进行处理,可以自适应学习图像边缘以及图像空间结构。此外,添加加权残差密集块可以弥补主干网络中多次采样操作造成的信息丢失。通过实验表明,该方法对航拍降质图像的恢复在主观和客观的衡量指标上均取得了更好实验效果。

关键词

无人机图像/图像去模糊/三维重建/生成对抗网络/注意力机制/残差网络

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

肖迎元/罗训

学位年度

2023

学位授予单位

天津理工大学

语种

中文

中图分类号

TP
段落导航相关论文