基于特征融合和注意力机制的小目标检测研究

王镆涵¹

扫码查看

作者信息

1. 华北理工大学
折叠

摘要

目标检测是当前机器学习中最为重要的研究领域之一，广泛应用于自动驾驶、遥感识别等领域中。在目标检测领域中，由于小目标本身特征信息较少、所占像素较少，小目标检测一直是目标检测领域中的一个难点。因此本课题采用深度学习的方法，使用基于特征融合和注意力机制的策略开展对于小目标检测的研究。针对目标检测任务中，小目标特征信息不足、检测率较低，且错、漏检率较高的缺点，提出一种基于多尺度特征融合以及混合注意力机制的 Tr-SSD 算法。通过融合不同尺度下的特征信息与选择性的关注骨干网络提取的有效信息来进一步提升小目标检测的性能。SSD使用了 VGG16作为骨干网络，为了解决其提取目标信息能力不足的问题，Tr-SSD 使用网络层数适中且特征提取能力较强的 Resnet50 网络作为骨干网络替换原本的 VGG16 网络。并且 Tr-SSD 中包含了一个关键的特征融合模块，该模块通过以Transformer为核心的网络层与SSD算法中本身的网络层构建 FPN 结构融合不同尺度下的信息，更好地利用小目标的位置信息与语义信息。此外，还包含了一个混合注意力模块（Selective Self-Attention，SeSA），SeSA 能够从全局角度对小目标进行定位，并为特征融合模块提供更准确的特征信息引导。得益于所提出的两个模块，Tr-SSD 能够更精确地检测小目标。在三个公共数据集（PASCAL VOC、HRSID、RSOD）上 Tr-SSD 算法的检测精度分别达到 81.9%、88.4%、87.5%，所提出的方法的检测精度优于相关领域的先进方法。在实际生活中，吸烟检测属于小目标检测的下游任务，吸烟检测任务同样面临着目标特征信息少、所占像素少的缺点，因此吸烟检测任务常被认为是小目标检测任务，吸烟检测任务同样具有挑战。本课题提出了一个包含 4445 张图像的吸烟检测数据集，将所使用的 Tr-SSD 检测算法应用到吸烟检测之中，并提出了一种用于吸烟检测的防火预警系统。

关键词

目标检测/Tr-SSD算法/特征融合/注意力机制

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

魏明军/王映红

学位年度

2023

学位授予单位

华北理工大学

语种

中文

中图分类号

段落导航