基于深度融合模型的多尺度目标检测方法研究

焦林¹

扫码查看

作者信息

1. 中国科学技术大学
折叠

摘要

目标检测是一种使计算机能够自动地在一幅图像中找出特定类别的物体，并给出物体相应位置的技术，是计算机视觉领域的研究热点之一。目标检测技术广泛应用在自动驾驶、智能监测、医疗诊断、智慧农业、工业检测等各个领域。尽管有长达数十年的研究历史，但是在面对复杂的真实场景时，物体检测算法的表现依然不尽如人意。因此，目标检测技术依然具有深入研究的学术价值以及工程应用价值。近年来深度卷积神经网络技术取得飞速的发展，通过大数据来驱动图像特征及其表达关系的自我学习方法，在系列大规模的图像识别，包括目标检测任务中表现出色。深度神经网络技术快速发展的同时，也意味着图像特征提取从人工设计特征到自动学习特征的转变。与传统的手工设计特征相比，卷积神经网络能够有效地从低层逐层组合成更加抽象的高层特征来揭示图像本质表征，在不同的目标检测任务场景中，效果显著。尽管基于深度卷积神经网络模型的目标检测任务取得很大进展，但在实际应用仍然面临众多挑战。当任务场景中图像背景复杂、模糊、物体变形;目标尺度极小以及尺度变化大，使得目标图像特征提取困难，从而导致检测精度低、泛化能力较弱。针对上述实际问题，本文从感受野目标区域生成、边界关键点感知、视觉注意机制、自适应特征融合四个方面来设计相应的目标检测网络，并成功应用到不同场景任务中。本文的研究内容如下所示: 1.提出一种基于感受野的目标区域生成网络，有效提升了目标区域候选框的质量。其关键流程是采用感受野区域代替通用的锚框作为参考框，去除了锚框参数冗余设置;优化基于有效感受野区域的正负样本选择策略，使得不同尺度物体的样本均参与到整个网络的训练与学习。在多个公共数据集上的对比实验结果表明，本文所提出方法提升了检测精度。 2.设计了一种基于边界关键点感知的双阶段目标检测器。所设计的检测器以两阶段目标检测框架为基础，通过设计边界关键点感知的区域推荐网络，以去除锚框作为参考框，解决了锚框参数设置复杂的弊端。该方法通过预测物体边界框关键点的方式得到目标感兴趣区域。大量的对比实验验证了所提出方法的检测效果，在两个大规模数据集上的表现均优于其他目标检测算法。 3.构建了一种融合视觉注意机制的小尺度目标检测模型。所提模型从三个角度解决小尺度目标检测精度低的问题。从增强网络特征表达角度考虑，将视觉注意机制引入到骨干网络，达到强化特征表达的目的;从缓解小尺度样本不平衡的角度出发，在区域推荐网络中引入了稀疏采样和新的训练样本选择方式;从增强感兴趣区域特征的角度出发，设计了一个自适应的特征选择模型。在小尺度农业害虫数据集上的具体实验结果表明，本文所提出的方法对小尺度目标检测具有较好的效果。 4.从特征融合角度，本文提出了一种自适应特征融合模型。模型的核心思路是通过网络学习的方式自适应地过滤来自其它层的无用信息，仅保留对目标识别有用的信息，以达到提升目标特征表达能力。其次，引入特征强化模块以增强特征金字塔网络最顶层目标特征的可辨识度。本文所设计的自适应特征网络植入到多阶段目标检测器能够改善目标检测的结果，尤其是小尺度目标检测的准确度。与此同时，所提模型在背景复杂的小尺度害虫数据集上也表现较佳。

关键词

目标检测/卷积神经网络/区域推荐框/特征融合

引用本文复制引用

授予学位

博士

学科专业

计算机应用技术

导师

王儒敬

学位年度

2021

学位授予单位

中国科学技术大学

语种

中文

中图分类号

段落导航