基于深度学习的交通场景目标检测和深度估计

陈新波¹

扫码查看

作者信息

1. 武汉科技大学
折叠

摘要

随着人们对交通出行的效率和安全性要求越来越高，解决交通出行中目标检测和深度估计的问题显得尤为重要。为了预防交通事故的发生，行驶车辆必须与前方行人车辆保持安全距离。目前目标检测和深度估计任务中存在目标识别精度低、位置定位精度差、雷达点云数据稀疏和多传感器数据融合困难等问题。本文基于深度学习的方法，将目标检测算法和单目深度估计算法结合起来，对给定的任意单张图像，输出带有深度信息的目标检测图像。本文的主要研究内容如下: (1)针对交通场景下车辆和行人识别精度不高的问题，本文提出基于YOLOv5的目标检测算法，该算法的主要框架包括特征提取主干网络、特征融合模块、目标预测这几部分。在特征提取主干网络部分加入了注意力机制，并用CIoU_Loss损失函数代替GIoU_Loss损失函数。实验结果表明，在验证集上改进之后模型的召回率由90％提高到93％。提出的网络模型，不仅仅提高了预测的精度，还有效的降低了损失，证明了本文的模型具有一定的优越性。 (2)针对图像深度估计的预测图局部细节不清晰的问题，提出了一种基于通道注意的自监督单目深度估计算法，主要是编码器-解码器的架构。在深度预测网络中加入了结构感知模块和细节强调模块，以捕获更多场景的上下文信息，并强调细节特征。在KITTI数据集和Make3D数据集上验证了所提方法的优越性能。在估计误差阀值δ＜1.253时，基于改进的Monodepth2单目深度估计模型精度由98.1％提高到98.3％。 (3)本文提出了基于深度学习的目标检测与深度估计算法，采用有监督的学习方式将目标检测任务和深度估计任务并联，提出了一个端到端的深度估计与目标检测的多任务模型。

关键词

深度学习/目标检测/YOLOv5/深度估计/注意力机制

引用本文复制引用

授予学位

硕士

学科专业

机械工程

导师

陶波

学位年度

2023

学位授予单位

武汉科技大学

语种

中文

中图分类号

段落导航