摘要
目标检测是计算机视觉领域的重要研究课题,在安防监控、无人驾驶、医学图像处理与分析、国家安全以及工业检测等诸多方面具有广泛应用。而小目标由于其像素分辨率低、有用信息匮乏、背景噪声干扰等因素,使得小目标检测成为目前的难点和具有挑战性的任务。现有的检测算法在检测结果中经常出现小目标漏检、错检等现象。为了提高小目标检测的精度,本文以YOLOv5为基础模型,以提升小目标的特征表达和改善小目标检测框的回归预测为切入点,分别提出基于多尺度语义增强、基于三分支解耦结构和形状损失的小目标检测算法。主要研究工作如下: (1)针对小目标分辨率低、携带的信息少、特征表达能力不足,而造成的小目标漏检问题,本文提出一种基于多尺度语义增强的小目标检测算法。首先,提出一种扩展特征金字塔改进YOLOv5采用的双层特征金字塔结构,以增强特征的多尺度学习,而特征的多尺度表示,特别是浅层特征的表示,有助于网络对小目标的检测。为了进一步增强小目标的特征表达能力,我们设计了一个基于多尺度构建的语义增强模块用于实现浅层特征和深层特征的多尺度融合。该模块能够缓解浅层和深层特征直接融合造成的“语义鸿沟”问题,可以实现浅层细节位置信息更有效的前馈,有助于浅层细节信息和深层语义信息的融合,从而提升检测网络中小目标的特征表示。实验结果表明,对于小目标,本文提出的基于多尺度语义增强的小目标检测方法能够实现更高的检出率,有效改善了检测结果中小目标的漏检现象。 (2)针对检测过程中小目标检测框回归预测不够精确的问题,本文以边界框回归系数的预测方式即检测头的设计和边界框回归损失为切入点,提出基于三分支解耦结构和形状损失的小目标检测算法。首先,基于现有的检测头设计,提出了一种三分支解耦检测头。该解耦检测头将分类、回归系数以及置信度分数三个任务的预测使用不同的分支独立处理,不同的任务使用不同特征提取分支,不仅可以改善回归系数的预测,也使得类别和置信度分数的预测更准确。然后,为了进一步改善边界框的回归精度,我们充分考虑预测框和目标真实标注框之间的形状差异,在现有回归损失的基础上提出了改进的形状损失,使得边界框在回归阶段更加精确。实验结果表明,本文提出的方法能够提升小目标的检出率,有效改善小目标的漏检和误检现象。