基于深度学习的行人重识别研究

丁鹏程¹

扫码查看

作者信息

1. 中国科学技术大学
折叠

摘要

随着计算机技术的发展和摄像头成本的不断降低，城市中监控摄像头的数量不断增加，视频监控系统在公共安全领域起到了重要作用。遍布机场、商场、仓库和民宅的摄像头为政府、公司和个人提供了大量的视频图像数据，为搜集证据、预防和追查犯罪以及居家安全等提供了便利。行人重识别旨在从候选行人图像中检索出给定行人图像，在智能视频监控系统中扮演着重要角色。但是监控摄像头每时每刻产生大量的视频图像数据，对这些数据的处理需要耗费大量的时间和人力，增加了公共安全服务的成本。近年来，深度学习不断发展，为高效、准确地处理摄像头监控系统产生的海量视频图像数据提供了有效手段。由于行人图像目标占比小，分辨率低，且个体之间相似度较高，直接将传统的深度学习方法用于行人重识别任务会存在误判、跨域性能差等诸多问题，因此，本文围绕深度学习方法在行人重识别中的应用展开研究，主要的研究工作及成果概括如下: (1)目前行人重识别领域常用全局特征和局部特征进行行人图像检索，但是全局特征难以避免背景造成的干扰，局部特征会因为行人图像不对齐的问题存在偏差。针对全局特征和局部特征的局限性，本文提出基于注意力机制的行人重识别方法。该方法通过空间注意力和通道注意力，能够为显著性区域和高区分度的特征分配更多权重，从而提高行人重识别模型的性能。本方法在Market-1501、DukeMTMC-reID和CUHK03数据集上进行了实验，与近几年的行人重识别方法相比，取得了较好的效果，实验结果证明了本方法的有效性。 (2)现有的行人重识别模型一般在单一数据集训练并测试时体现出了优良的性能，但是当该模型在一个数据集上训练(通常称为源域)，在另一个数据集上测试时(通常称之为目标域)，性能会发生巨大下降。为了解决行人重识别的领域自适应问题，提高模型跨域性能，减少图像人工标注耗费的时间和人力，本文提出了基于局部不变性的跨域行人重识别方法。该方法利用目标域的局部不变性、摄像头不变性和k近邻不变性，设计了一个存储器(memory)结构在无标签的情况下衡量目标域的损失，使得具有相同行人身份的无标签目标域图像在每轮训练的过程中能互相靠近。最后将该方法在现有数据集上进行实验并与现有的跨域行人重识别方法进行比较，取得了较好的效果，验证了本文提出方法的有效性。

关键词

行人重识别/深度学习/注意力机制/领域自适应

引用本文复制引用

授予学位

硕士

学科专业

计算机应用技术

导师

万寿红

学位年度

2021

学位授予单位

中国科学技术大学

语种

中文

中图分类号

段落导航