基于深度学习的行人再识别算法研究

赵巍¹

扫码查看

作者信息

1. 郑州大学
折叠

摘要

近年来，随着科技的发展以及智能监控设备的普及，行人再识别已成为智能监控系统中一项关键技术。行人再识别的主要任务是在多个摄像头拍摄的视频中，跨越时间与空间检索目标行人。由于监控设备拍摄的行人存在角度与光照的变化、分辨率的不同、目标遮挡以及服装更换等问题，行人再识别技术仍然面临着巨大挑战。本文对行人再识别技术进行了深入的探索，分别从全身特征与面部特征的角度出发提出了两种新颖的行人再识别模型。具体工作与创新归纳如下: 针对现有行人再识别方法缺乏对光照、视角、以及姿势变化鲁棒性的问题，提出一个 Multi-Granular Spatial-Temporal Network(MSTN)模型用于基于全身特征的行人再识别。该模型中包含两个即插即用的模块，分别为时间核注意力模块(TKA)和特征分解空间注意力模块(FDSA)。TKA模块通过多个时间维度上扩张率不同的扩张卷积，来提取视频中短期与长期的时间关系，并自适应地对特征分配权重;FDSA模块则使用视频的全局特征来引导输入特征分解为高相关特征与低相关特征，并分别增强两个特征中有助于识别的元素。通过结合两个模块,MSTN能够提取视频中多粒度的时空特征，从而降低姿势、光照、变化、分辨率、目标遮挡所造成的不利影响。为验证所提方法的有效性，MSTN在全身特征数据集(MARS、DukeMTMC-VID、iLIDS-VID)上进行了性能评估。其中，在 MARS数据集上Rank-1评价指标达到91.0％,mAP指标达到86. 1％。针对现有行人再识别方法对衣服更换缺乏鲁棒性的问题，提出一个具有遮挡鲁棒性的人脸再识别算法。该算法提取行人面部特征进行识别，不受行人衣物更换的影响。该算法为了降低监控视频中面部遮挡的不利影响，使用掩码字典和分区域匹配方法舍弃部分受遮挡影响的元素，提高了面部遮挡情况下模型的识别准确率;为了应对监控视频中面部图像质量不同的问题，该算法使用时间注意力机制自适应的对各帧图像分配权重。为验证所提方法的有效性，该人脸再识别方法在面部监控数据集(COX,COX-Masked)上进行了性能评估。其中，在COX数据集上Rank-1指标达到95.2％,在COX-Masked数据集上Rank-1指标达到73.0％。

关键词

行人再识别/卷积神经网络/注意力机制/分区域匹配/深度学习

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

张博

学位年度

2023

学位授予单位

郑州大学

语种

中文

中图分类号

段落导航