首页|基于改进YOLO与知识蒸馏的无人机航拍图像目标检测方法研究

基于改进YOLO与知识蒸馏的无人机航拍图像目标检测方法研究

郝紫霄

基于改进YOLO与知识蒸馏的无人机航拍图像目标检测方法研究

郝紫霄1
扫码查看

作者信息

  • 1. 江苏科技大学
  • 折叠

摘要

目标检测作为计算机视觉领域的研究中的重要课题,一直备受重视。随着无人机技术、卫星遥感技术、航空航天技术等的发展,航拍图像目标检测已成为研究热点。无人机航拍图像是航拍图像的重要分支,是以无人机作为图像传感器的空中搭载平台所拍摄的图像。然而,航拍图像区别于普通图像,具有背景信息复杂、目标尺度小、目标具有显著的方向性且分布稀疏不均等特点,这使得航拍图像的目标检测,尤其是小目标检测充满挑战,小目标的漏检率及误检率较高,且检测速度较低。本文针对无人机航拍图像小目标检测所面临的问题,进行相关研究。 本文选用YOLO-v5(YouOnlyLookOnce-v5)作为基础算法。该算法在无人机航拍图像实时检测中具有很高的精度,但时空复杂度较高,模型结构较为复杂,使得实时性不满足无人机航拍图像目标检测任务的需求。根据YOLO-v5在无人机航拍图像小目标检测中存在的问题,对算法进行针对性的优化,使优化后的算法可以被有效应用于无人机航拍图像小目标检测中。本文的研究重点可以划分为以下几个方面: 第一,改进基础的YOLO-v5算法,并命名为GFC-YOLO-v5优化算法。首先,利用轻量化网络降低时空复杂度,搭建GhostModule模块并利用GhostModule构建GhostBottleneck瓶颈结构;利用GhostBottleneck构建GhostNet网络;修改网络接口,将GhostNet的输出层作为有效特征层,进行加强特征提取。然后,对卷积模块的激活函数进行处理,YOLO-v5的卷积模块中的SiLU激活函数的空间敏感度较低,针对这个问题,采用FReLU函数作为激活函数,克服线性模型的局限性,使模型具备更高的检测能力。最后,在骨干网络(BackboneNet)中添加CBAM注意力机制模块,融合通道注意力与空间注意力机制,提高目标检测网络检测速度,节省参数与计算力,将参数量由7030417轻量化为3774347。 第二,GFC-YOLO-v5算法的时空复杂度得到了大幅度降低,但其检测精度有所影响。为提升轻量化网络的精度,将YOLO-v5m、YOLO-v5l网络的卷积模块中的激活函数由SiLU替换为FReLU,分别命名为FReLU-YOLO-v5m/l,以上述精度很高但体积较大的网络作为教师网络,以GFC-YOLO-v5作为学生网络,修改损失函数,在自定义数据集中进行知识蒸馏。经过知识蒸馏后的GFC-YOLO-v5在其显著的模型轻量化优势的前提下,精度得以提升至90.6%。 第三,将本文方法应用于无人机航拍图像小目标检测,无人机具有操控简单、飞行灵活、成本低等优点。通过自采集无人机图像与公开数据集图像构建针对小目标的无人机图像数据集:PCUS-DataSets与SMALL-TINY-UAV-DATASET。进行对比实验与消融实验,通过精确率、召回率、检测速度、时空复杂度等方面进行分析。通过实验验证,改进后的GFC-YOLO-v5的参数量相比原始YOLO-v5s减少了46.3%;改进后的GFC-YOLO-v5的计算量相比原始YOLO-v5s降低了46.54%。经过知识蒸馏后的Distilled-GFC-YOLO-v5的精确率相比GFC-YOLO-v5提升了6.7个百分点,相比原始YOLO-v5s提升了1.2个百分点。在优化算法基础上进行知识蒸馏后,改进算法实现了准确度与时空复杂度的双重优势。

关键词

无人机航拍图像/YOLO-v5/知识蒸馏/目标检测/注意力机制

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

王琦

学位年度

2023

学位授予单位

江苏科技大学

语种

中文

中图分类号

TP
段落导航相关论文