摘要
深度学习以其强大的学习能力和普适性等优点,在目标检测等诸多领域中彰显出优秀的性能。YOLOv5作为深度学习目标检测领域具有代表性的模型之一,虽然在检测精度方面取得了显著的提升,但模型的复杂度较高,难以应用于移动端、嵌入式等存储资源和算力资源有限的平台。针对上述问题,本文以YOLOv5s为基础模型对其进行轻量化研究,主要的研究内容如下: (1)为了在保证YOLOv5s模型检测精度的前提下,降低模型的参数量和计算量,本文提出了一种基于多尺度特征融合的轻量化目标检测算法GMFF-YOLO。该算法首先设计了多尺度特征融合的MFF-Bottleneck结构,并替换PANet中的Bottleneck结构,使其可以获取更加丰富的语义信息,增强网络的特征融合能力;其次使用轻量级的GSConv结构替换YOLOv5s模型中单独的卷积层,使其更加轻量化;最后在多个数据集上进行实验,验证GMFF-YOLO模型的性能。 (2)为了进一步提高GMFF-YOLO模型的推理速度,使其更加轻量化,本文提出了一种基于混合结构通道剪枝的模型压缩算法。该算法采用BN层稀疏化的通道剪枝算法框架,首先在GMFF-YOLO模型稀疏化训练的过程中设计了稀疏因子的调整策略;其次针对GMFF-YOLO模型的GSConv和MFF-Bottleneck两种混合结构分别设计了通道剪枝算法,并对稀疏训练结束后的GMFF-YOLO模型进行剪枝;然后针对GMFF-YOLO剪枝模型存在精度下降的问题,采用知识蒸馏方法对其进行精度微调训练;最后通过实验证明该模型压缩算法的有效性。 (3)通过使用TensorRT深度学习加速框架将YOLOv5s、GMFF-YOLO和GMFF-YOLO剪枝模型分别部署在Jetson TX2嵌入式平台上,并采用TensorRT FP32模型和TensorRT FP16模型进行推理实验,进一步验证(1)和(2)中所提算法对YOLOv5s模型轻量化的有效性和可行性。