基于深度学习的自动驾驶场景下行人检测算法研究

张伦¹

扫码查看

作者信息

1. 广西科技大学
折叠

摘要

行人检测是计算机视觉领域中的一个重要研究分支，在自动驾驶系统中发挥着关键的技术支撑作用，可以有效地保障行车安全，提升自动驾驶技术的可靠性和舒适性。然而在复杂的自动驾驶场景下，行人检测存在着众多挑战。一方面，距离车载摄像头不同远近的行人尺度差异较大，距离较远的小尺度行人很难被检测到，而且光照变化和背景干扰等因素也增加了行人检测的难度。另一方面，拥挤人群的相互遮挡以及行人被道路上其他物体所遮挡容易导致误检或漏检情况的出现。针对上述问题，本文以基于深度学习的行人检测算法为基础进行研究与改进，主要工作内容如下：（1）构建驾驶场景行人数据集。首先，详细介绍了目前主流的驾驶场景数据集。其次，根据数据集的多样性对比结果，并考虑国内外道路交通的环境差异，进而选择具有挑战性的CityPersons数据集和SODA10M数据集。最后，鉴于SODA10M训练集缺少夜晚图像，通过自制夜晚数据集的方式对其进行扩充。（2）针对SSD（SingleShotMultiBoxDetector）算法在驾驶场景下存在小尺度行人大量漏检的问题，提出一种多尺度特征融合的小尺度行人检测算法。首先，根据数据集分辨率的特点对SSD网络的输入方式进行优化，同时重新设置SSD默认先验框的尺寸和宽高比，以获取更匹配数据集行人真实框的先验框。其次，在多尺度检测阶段，增加浅层高分辨率特征图来提高检测小尺度行人的能力，并剔除冗余的深层特征图以提升检测效率。最后，提出一种能够弥补浅层特征图中行人语义信息的特征融合模块。实验结果表明，所提算法可以有效减少小尺度行人的漏检，在不同数据集上都具有较好的检测效果。（3）针对驾驶场景下普遍存在的行人遮挡问题，同时考虑到模型的计算开销和储存空间，本文以YOLOX-Tiny网络架构为基础，提出一种基于注意力机制的遮挡行人检测算法。首先，选择在特征融合网络中加入高效通道注意力模块，增强模型对遮挡行人可见区域的关注度。其次，采用基于距离交并比的边界框回归损失函数，提升遮挡行人的定位精度。最后，利用结构重参数化加快模型推理速度，同时降低模型复杂度。实验结果表明，提出的算法可以有效改善遮挡行人的检测效果，在保证轻量化的同时具有较佳的检测性能。

关键词

行人检测/深度学习/特征融合/注意力机制/自动驾驶

引用本文复制引用

授予学位

硕士

学科专业

控制科学与工程

导师

谭光兴

学位年度

2023

学位授予单位

广西科技大学

语种

中文

中图分类号

段落导航