基于关键点和超图学习的视频行人重识别

郭威¹

扫码查看

作者信息

1. 中国科学院大学
折叠

摘要

行人重识别（PersonRe-Identification，Re-ID）是计算机视觉领域中一个重要的研究课题，主要应用于复杂环境下的图像处理和分析，其目标是将不同环境下的特定行人识别出来。近年来，行人重识别越来越多的应用在监控、商超和智慧城市等现实场景中，引起了学术界和工业界的广泛关注。随着深度学习技术的快速发展和大规模数据集的发布，行人重识别取得了前所未有的突破。然而，该领域目前仍面临着诸多挑战，包括行人姿态变化、背景复杂以及遮挡等问题，给行人重识别带来了相当大的检索难度。现有的研究方法未能充分解决这些问题，因此，研究特定场景下的行人重识别并提升其准确性和鲁棒性具有重要的应用价值。本文使用深度学习的方法来研究视频类型的行人重识别。针对面临的背景复杂等问题，使用基于关键点检测技术的方法来构建人体的多粒度部位特征，关键部位是对行人重要且有辨识度的区域，可以更可靠地确认是否为同一人。超图神经网络具有建模高阶关系的特性，可以有效捕捉视频中的时序信息。通过基于关键部位的超图学习，遮挡错位部分得到补充，缓解了姿态不对齐等问题。本文提出的基于关键点和超图学习的方法既能更准确的学习到人体的重要部位特征，又能充分挖掘视频中的时空信息，从而取得了很好的识别效果。本文的主要贡献包括: 1）提出了一个基于关键点检测的多粒度特征提取方法。采用关键点掩码的方法精准定位和构建三种不同粒度的部位特征，该方法提取视频序列中的空间特征，增加了人体关键部位对行人表示的贡献，同时，多粒度的部位特征支持了更细腻的行人表示。 2）提出了一个基于超图神经网络的部位特征学习与融合框架。该框架构建了多个粒度的超图神经网络来学习关键部位特征，利用视频序列中的时空信息，遮挡错位部位得到补充，缓解了姿态不对齐和遮挡等问题。引入时空初始化块在时间、空间和时空上对人体部位特征进行初始化，更好的建模超图节点之间的结构关系，并引入差异化学习单元激励超图之间的多样性，生成互补的超图表示。 3）在三个公开数据集上开展实验，验证了本文提出的基于关键点和超图学习框架的有效性。本文的方法在ILIDS-VID数据集上达到了93.1％的rank-1精度，优于现有其他方法。在MARS数据集和PRID-2011数据集上，实验结果也接近目前最优方法。

关键词

视频行人重识别/关键点/超图学习/计算机视觉

引用本文复制引用

授予学位

硕士

学科专业

网络空间安全

导师

葛敬国

学位年度

2023

学位授予单位

中国科学院大学

语种

中文

中图分类号

段落导航