基于Transformer模型与对比学习的车辆重识别方法研究

高亚飞¹

扫码查看

作者信息

1. 安徽大学
折叠

摘要

近几年，中国城市化进程明显加速，在城市体量增大的同时，人口和车辆也变得越来越密集，与此同时带来的问题就是交通状况异常拥堵以及治安恶化等。智慧交通是一种新型服务体系，在高科技产业的全面渗透下，政府部门也在加大对智慧交通的建设和投入，未来必将更大范围影响着我们的日常生活。随着“天网”和“雪亮工程”等大规模监控体系的完善和覆盖，合理有效的利用这些监控数据，对未来构建智慧交通具有非常重要的意义。而车辆作为整个城市中最重要的监控对象之一，它是构建智慧交通的基础和命脉。如何挖掘其深层次的特征信息，利用技术手段发现潜在的数据价值，并在其基础上构建有效的算法预测模型，是推进该领域研究的关键。车辆重识别是指根据给定的车辆图形图像、视频序列，从海量的监控数据中快速检索到某个特定车辆并进行判断，它被经常应用于解决一些因视野丢失或跨视角跨相机的再匹配或追踪问题。该领域目前面临的挑战主要有：车辆在受到视角、光照、分辨率等客观因素条件影响下产生的类内偏差和类间相似。因此，针对这些挑战，在现有工作的基础上，本文给出了两类解决方案，具体的工作内容如下： (1)基于Swin Transformer网络对其全局特征编码器进行了改进，并给出了一种局部突出特征重排模块。该模块通过SSD检测器和自适应注意力学习机制提取车辆上局部区域的细粒度特征。同时，在网络的嵌入层中将局部突出特征进行重排重分组操作，并和全局特征进行有效融合。实验结果表明本文的模型相比于传统CNN的算法更为鲁棒。除此之外，本文给出的局部突出特征重排模块可以嵌入包括Swin Transformer、ViT和DeiT等主流Transformer结构，同样能够进一步提高重识别性能。这也验证了本文方法的通用性。 (2)监督学习算法目前已在车辆重识别领域取得了较高的准确率，然而局限性也很明显，它需要花费大量的时间人力成本，对车辆数据进行标注，在真实的交通监控场景下，很难得到快速的推广应用。因此本文在自监督学习策略下，提出了几种适合重识别任务的数据增强方式。同时，初步探索了基于CNN模型的MoCov2以及基于Transformer模型的MoCov3和DINO等对比学习框架，在车辆重识别领域的应用。

关键词

车辆重识别/图像处理/特征提取/对比学习

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

郑爱华

学位年度

2022

学位授予单位

安徽大学

语种

中文

中图分类号

段落导航