基于深度学习的遮挡行人重识别技术研究

王泽¹

扫码查看

作者信息

1. 西安电子科技大学
折叠

摘要

行人重识别(PersonRe-Identification，Re-ID)是图像检索领域的子问题，其利用计算机视觉方法确定特定行人是否出现在图像或者视频序列中。近年来，深度学习在计算机视觉任务上发展迅速，基于深度学习的行人重识别方法在智能安防、刑侦识别、智慧交通等领域均得到了广泛应用，但不免会受到自然场景中遮挡等不良因素的影响，例如行人互相遮挡、障碍物遮挡等，因此制约了行人重识别在实际场景中的应用且带来了严峻的挑战。本文面向遮挡环境下的遮挡行人重识别问题，基于深度学习技术提出了一些相对应的解决方法，主要包含以下三个方面: (1)针对行人重识别数据集中图像数量不足与图像中存在的遮挡影响重识别准确率的问题，本文从图像自身所携带的像素信息可用性角度出发，提出了一种基于生成式对抗网络的遮挡行人图像修复算法(PedestrianImageInpaintingGAN，PIIGAN)。该算法由生成器网络和判别器网络组成，生成器网络部分采用编解码结构，通过跳跃连接层与平移层捕捉图片整体结构语义信息，将已知区域的嵌入特征表达平移到未知区域进行修复。利用引导损失最小化解码器特征与遮挡图像的编码器特征之间的距离。通过实验验证，与传统的图像修复算法相比，PIIGAN修复得到的行人图像具有更清晰的语义特征和更精细的纹理特征，且修复后的图像可以实现对数据集的有效扩充，同时将修复后的数据用于重识别任务可以大幅提高重识别准确率。 (2)针对遮挡重识别任务中传统三元组损失函数的不足，本文提出一种质心损失函数，将其点对点计算的形式扩展成点对集计算，通过样本集聚合对可能出现的异常值进行抑制。针对遮挡行人图像难以提取判别力特征问题，本文提出了一种联合非局部注意力网络与质心损失的重识别算法(JointNon-localAttentionandCentroidLossNetwork，JACL-Net)。该算法将非局部注意力网络融入骨干网络学习不同距离像素之间的关系，利用质心损失与原有三元组中心损失进行融合从而使网络学习到更具辨别力的行人特征，最后通过提取全局特征进行相似性度量匹配。经过实验验证，在遮挡数据集Occluded-Duke上，Rank-1/mAP指标超过基准模型13.50％/10.30％;在遮挡数据集Occluded-ReID上，Rank-1/mAP指标超过基准模型8.20％/10.2％。与现有先进方法在遮挡与标准数据集上的性能相比，JACL-Net的Rank-1准确率与mAP也均有提升。实验验证表明，该算法可以对图像高判别力特征进行有效提取，在遮挡数据集与无遮挡数据集上具有较高的泛化性。与现有的先进行人重识别其他算法相比也具有一定的优越性。 (3)在上述图像遮挡恢复和特征提取算法研究的基础上，为了进一步验证所提重识别算法的性能，本文设计并实现了一个行人重识别智能监控系统。系统通过用户上传待检索行人图片，将该图片经过本地行人重识别算法模型提取特征后，与数据库中的行人特征进行相似性度量匹配，最终检索出目标人员。实验验证，本文所提重识别算法具有较好的性能，且系统在实际场景下具有较强的实用价值。

关键词

遮挡行人重识别/图像修复/度量学习/非局部注意力网络

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

田玉敏；张文琪

学位年度

2022

学位授予单位

西安电子科技大学

语种

中文

中图分类号

段落导航