基于深度学习的交通参与者定位与识别

王慧¹

扫码查看

作者信息

1. 西安电子科技大学
折叠

摘要

交通参与者的定位与识别是智能交通系统中的关键技术。目前在一些特定场景下，现有模型已经取得了较大的成果，但是在复杂的道路监控场景下，受目标的大小、清晰度，形态等因素的影响，定位与识别精度不够高，也很难在速度和精度上达到很好的权衡。深度学习的广泛使用对计算机视觉的发展产生了变革性影响，很多效果较好的定位与识别算法都利用了深度学习。针对车路协同系统中交通参与者的定位与识别任务，本文基于现有的目标检测和图像分类深度模型，设计了能够有效提升精度且满足速度要求的交通参与者定位与识别算法。本文利用从多个卡口的监控摄像头采集的不同场景、不同时间段的真实道路图像，通过筛选、标注等步骤，构建了目标检测数据集。将监控图像中的目标框与背景分离，再次进行筛选、标注，从而构建了分类数据集。基于上述自建数据集进行了目标检测和图像分类任务的算法设计，具体内容如下: 针对目标检测问题，对YOLOv5s进行改进，给出一个新的深度网络模型，称为D-YOLO。具体创新点包括:为了加强对小目标的检测能力，并稳定检测精确率，在YOLOv5s的基础上增加了检测尺度并适度加深网络;借助CSP-Net的思想将输入SPP模块的特征分成两部分运算，从而提出了CSPSPP结构，它既能提高特征的利用率，又减少了计算量;将FocalLoss运用在置信度损失和分类损失上，解决样本不平衡的问题;增加了FocalCIOU+Loss和DistributionFocalLoss缓解边界框和目标中心点预测不准确的问题。在自建数据集上进行训练和测试，实验结果表明，D-YOLO检测模型能够很好地完成对交通参与者的定位任务，在复杂场景测试集下可以实现91.4％的mAP值，81.7％的Recall值。针对图像分类任务，对ResNet18进行改进，提出一个新的分类模型，称为T-ResNet。具体创新点包括:减少网络中的残差块，增加特征融合块，既增强了特征的表达能力，又可以合理控制网络深度，使其适用于大样本;在剩余残差块中使用深度可分离卷积替换部分卷积层，减少计算量，加快分类速度;去掉浅层BN层，使网络更好的捕捉到多变化的特征分布;引入CombinedMarginLoss作为损失函数，在角度空间内学习目标特征，缩小类内差距，增大类间差距。在自建数据集上进行训练和测试，实验结果表明，T-ResNet分类模型能够较好地完成对交通参与者的识别任务，提升了模型精度且加快了速度，对于七分类测试集可以实现99.5％的精度以及9.24ms的速度，最终的交通参与者定位与识别模型达到了81.3％的准确率。

关键词

深度学习/车路协同/交通参与者/目标检测/图像分类

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

王卫卫；林焕凯

学位年度

2022

学位授予单位

西安电子科技大学

语种

中文

中图分类号

段落导航