摘要
随着人们对交通出行的效率和安全性要求越来越高,解决交通出行中目标检测和深度估计的问题显得尤为重要。为了预防交通事故的发生,行驶车辆必须与前方行人车辆保持安全距离。目前目标检测和深度估计任务中存在目标识别精度低、位置定位精度差、雷达点云数据稀疏和多传感器数据融合困难等问题。本文基于深度学习的方法,将目标检测算法和单目深度估计算法结合起来,对给定的任意单张图像,输出带有深度信息的目标检测图像。本文的主要研究内容如下: (1)针对交通场景下车辆和行人识别精度不高的问题,本文提出基于YOLOv5的目标检测算法,该算法的主要框架包括特征提取主干网络、特征融合模块、目标预测这几部分。在特征提取主干网络部分加入了注意力机制,并用CIoU_Loss损失函数代替GIoU_Loss损失函数。实验结果表明,在验证集上改进之后模型的召回率由90%提高到93%。提出的网络模型,不仅仅提高了预测的精度,还有效的降低了损失,证明了本文的模型具有一定的优越性。 (2)针对图像深度估计的预测图局部细节不清晰的问题,提出了一种基于通道注意的自监督单目深度估计算法,主要是编码器-解码器的架构。在深度预测网络中加入了结构感知模块和细节强调模块,以捕获更多场景的上下文信息,并强调细节特征。在KITTI数据集和Make3D数据集上验证了所提方法的优越性能。在估计误差阀值δ<1.253时,基于改进的Monodepth2单目深度估计模型精度由98.1%提高到98.3%。 (3)本文提出了基于深度学习的目标检测与深度估计算法,采用有监督的学习方式将目标检测任务和深度估计任务并联,提出了一个端到端的深度估计与目标检测的多任务模型。