摘要
近些年来,自动驾驶和计算机视觉热度持续高涨,而自动驾驶和计算机视觉的重中之重是目标检测。自动驾驶车辆通常使用激光雷达搭配多个光学镜头和摄像头来实现目标检测,因为激光雷达能够采集到更多的深度点云信息,所以相比于二维图像得到的信息更加精准和立体,更能加深对环境的理解。但是目前将点云数据用于三维目标检测的方法存在参数量和计算量较高以及目标检测时间较长的问题,距离实时检测还有一定的差距,无法运用到实际场景中。基于以上问题,本文将在保持检测精度的情况下对三维目标检测网络进行轻量化改进来解决以上问题。 本文主要研究内容如下: (1)提出了一种基于分离卷积网络的轻量化三维目标检测算法(Complex-YOLOv4-DeepSeparationGhost,Complex-YOLOv4-DSG)。首先在构建鸟瞰图时通过减少二维网格大小来提高构建效率,以此充分利用鸟瞰图的最大高度、最大强度和最大密度通道特征信息。针对当前特征提取网络YOLOv4-tiny参数量、计算量较大的问题,本文提出对YOLOv4-tiny主干网络进行轻量化改进,使用深度可分离卷积来代替残差组件中的标准卷积,并将残差组件改进为逆残差组件,最后在多尺度特征融合时进行通道特征图拼接实现大幅降低网络整体计算量的同时增强特征信息。 (2)针对改进后的轻量化三维目标检测方法的检测精准度偏低的问题,本文提出在改进后的轻量化网络中添加双重注意力机制再进行三维目标检测的方法,该方法通过添加通道注意力机制来分配每个通道不同的权重之后,利用坐标注意力机制将位置信息嵌入到通道中,目的是为了让网络关注更重要的特征,同时把空间位置信息也添加到特征中,从而保证在回归网络中拥有更多的特征信息。本文同时也对网络的损失函数做了改变,提出将MSE(MeanSquaredError)损失函数更换为GIOU(GeneralizedIntersectionOverUnion)损失函数,从而加快网络的收敛速度。本文在KITTI数据集上进行实验,结果证明改进的基于注意力机制的算法拥有更好的性能,使得三维目标检测的平均精准度有了显著的提高,特别是针对汽车和自行车类别效果更佳,提升幅度分别达到2.16%和4.09%。