摘要
3D目标检测技术是自动驾驶感知系统的重要组成部分,该技术能够检测出关键目标在三维空间中的位置、大小和类别,为车辆预测和规划提供可靠的观察结果。在使用的多种数据中,LiDAR点云提供了准确的三维深度信息,图像包含了丰富的纹理色彩信息,这两种数据能够相互补充。因此,基于图像和LiDAR点云的3D目标检测在自动驾驶领域得到广泛应用。然而,由于不同数据之间的表征差异性较大、车辆的行驶环境复杂多变,3D目标检测任务面临巨大挑战,针对上述问题的研究具有重要的工程意义和实用价值。 本文对基于伪点云生成和LiDAR点云融合的3D目标检测方法进行了研究,针对3D目标检测中图像和LiDAR点云的模态表征差异性较大、小目标检测效果较差和特征融合位置不够精确、融合尺度单一的问题,本文分别从目标检测的模态表达、特征提取和特征融合三个阶段展开了研究: (1)针对LiDAR点云和图像表征差异较大的问题,提出了一种基于去阴影图像辅助的深度补全网络。首先设计了去阴影图像辅助模块,消除了图像中阴影区域对深度补全网络的影响;然后构建了全局-局部卷积模块来优化特征提取,从而实现了有效的深度补全,为伪点云的生成奠定基础。伪点云的表征方式与LiDAR点云相同,具有图像的全部信息。在KITTI深度补全数据集上的实验取得了优秀的结果,验证了提出网络的有效性。 (2)针对小目标检测效果不佳的问题,提出了一种基于伪点云多尺度体素化的3D目标检测模型。首先提出了一种伪点云快速投影方法将图像及其预测深度图投影为伪点云;然后,构建了跨模态信息编码模块,使伪点云同时具有了三维空间和二维平面的邻域位置信息;最后,设计了多尺度体素特征提取模块,将伪点云进行多尺度体素化,并使用自底向上的稀疏卷积进行特征提取。在KITTI公开数据集上的实验表明,所提出模型对小目标检测的平均精度(AveragePrecision,AP)较基准模型提升了1.52%,验证了设计模块的有效性。 (3)针对特征融合位置不够精确、融合尺度单一的问题,提出了一种基于LiDAR点云和伪点云逐网格融合的3D目标检测模型,设计了一种逐网格特征融合模块,能够精确地融合两种模态中同一目标的高维特征和低维特征;在模型的模态表达和特征提取阶段分别采用了前面两个研究内容的成果。该模型在KITTI公开数据集上检测的平均精度(AP)达到了85.12%,证明了本文提出模块共同作用的有效性。