首页|基于改进YOLOv5的无人机图像目标检测算法

基于改进YOLOv5的无人机图像目标检测算法

杨佳乐

基于改进YOLOv5的无人机图像目标检测算法

杨佳乐1
扫码查看

作者信息

  • 1. 复旦大学
  • 折叠

摘要

随着无人机技术的不断发展和广泛应用,无人机图像处理技术的需求逐渐增加。目标检测作为图像处理的经典任务,在无人机视觉领域有着重要意义。然而,由于无人机图像通常是从高空拍摄的,具有视场大、小目标多且密集等特点,一般的目标检测算法在应用于无人机所拍摄图像时性能下降明显。近年来,越来越多学者开始关注实际应用场景中的小目标检测问题,无人机图像中的小目标检测逐渐成为目前主流的研究方向。 本文主要围绕无人机图像中的小目标检测问题,以轻量化的YOLOv5模型为基准网络,提出了一种基于改进YOLOv5的无人机图像目标检测算法,在满足实时性要求的同时提高小目标检测的精度。首先,本文设计并提出了一种优化的特征提取网络,通过增加浅层特征的提取和融合,提升模型多尺度目标检测性能。同时增加了一个针对微小目标的检测头,有效降低小目标的漏检率。其次,在主干网络引入CBAM注意力机制,并采用NWD度量进行NMS操作,提升模型的检测精度和鲁棒性,有效抑制冗余边界框。最后,通过一系列消融、横向对比实验验证了本文所提出算法相较于原始的YOLOv5模型在平均精度和整体性能方面均有显著提升,在VisDrone-2020数据集上的性能表现也优于其他算法,在无人机图像目标检测应用领域表现出巨大潜力。本文的主要工作和创新点如下: (1)针对无人机图像的多尺度问题和小目标的漏检问题,本文优化了特征提取网络,增加了更浅层特征的提取和融合,保留了更多的浅层细粒度信息,有利于增强多尺度特征图的表达能力,从而更好地进行多尺度目标检测。同时,增加了一个专门针对小目标的检测头P2,对特征图进行更细致的网格划分,增加了网格密度,有效降低了小目标的漏检率。 (2)针对图像中的背景和噪声干扰问题,本文在主干网络部分的C3模块引入了 CBAM注意力机制,加强C3模块中残差块的特征表达能力和感知能力,增强模型对较难识别的小目标的关注度,提高模型的检测精度和鲁棒性。 (3)针对IoU对小目标位置偏差的敏感性问题,本文在后处理时采用NWD度量代替原本的IoU进行NMS操作,将边界框建模成二维高斯分布,通过对应的高斯分布计算两框的相似性,避免了 IoU对小目标位置变化的敏感性,从而更好地抑制冗余边界框。

关键词

无人机图像/目标检测/YOLOv5模型/多尺度特征融合/注意力机制/高斯分布

引用本文复制引用

授予学位

硕士

学科专业

人工智能

导师

陈雄

学位年度

2023

学位授予单位

复旦大学

语种

中文

中图分类号

TP
段落导航相关论文