摘要
目标检测是计算机视觉的基础问题之一,在智慧交通、智能安防和工业缺陷检测等诸多领域有着广泛的应用。基于深度卷积神经网络的目标检测算法在不同场景的任务中表现出了卓越的性能,但庞大的计算和存储资源需求严重限制了相关算法在资源有限的边缘设备上的落地应用。论文围绕基于深度卷积神经网络的目标检测模型的轻量化算法展开研究,从模型加速和性能提升两个方面出发,分别提出了适用于目标检测模型的动态门控系统衍生的通道剪枝算法和上下文感知的知识蒸馏算法,并利用二者的轻量化特性设计了轻量化联合算法框架。本文的主要贡献如下: 1.针对传统模型剪枝算法由于对剪除对象评估不全面而严重破坏模型原有精度的问题,在引入动态通道剪枝策略为网络节点提供合适评估标准的基础上,提出一种适用于目标检测的动态门控系统衍生的通道剪枝算法。该方法充分融合动态剪枝以输入为导向的动态调节优势以及静态剪枝的模型精简能力,在保证精度的前提下生成结构更精简、速度更快的目标检测模型。在目标检测数据集VOC上的实验结果证明了该算法的有效性和通用性,不同模型的大小均缩减39.6%以上,计算量减小42.9%以上,同时性能下降不超过1.6%。 2.针对结构简单的目标检测模型往往精度较低的问题,提出了一种适用于目标检测的上下文感知知识蒸馏算法。该算法包含上下文感知模块和自注意力机制,可以充分利用被检测目标的上下文信息,从空间域和通道域同时提取并精炼教师网络的知识,并使用精炼后的知识作为学生网络训练过程中的额外监督信息。在对该算法进行的有效性和通用性验证实验中,基于不同骨干网络的检测器在VOC和KITTI数据集上均取得了超过2.9%的性能提升。 3.针对模型剪枝损失精度以及知识蒸馏无法独立完成轻量化任务的问题,提出一种基于模型剪枝与知识蒸馏的轻量化联合算法框架。首先使用动态门控系统衍生的通道剪枝算法进行剪枝,减少参数量;然后使用上下文感知知识蒸馏算法提升精度,得到参数量小、推理速度快且精度较高的轻量级模型。在实验中,输出的轻量级模型在保持基线模型精度的同时,参数压缩超过48.2%,计算量下降53.1%以上,证明了所提出的算法框架的有效性。