基于深度学习的行人重识别研究

黄盼¹

扫码查看

作者信息

1. 南京邮电大学
折叠

摘要

随着科技的进步和智慧城市的发展，人们对公共安全的需求不断提高，海量视频监控系统已经广泛部署在机场、社区、街道、商场等公共场所，如何高效智能化地分析拍摄的海量视频及图像数据从而实现安防监控与刑事侦查，成为当下研究热点。作为智能视频监控系统中的一种前沿技术，行人重识别受到了学者们的青睐，其主要任务是匹配多摄像头下的同一目标行人。近年来，随着深度学习技术的不断发展，行人重识别领域出现了大量的研究成果。然而，实际监控场景下的视频图像容易受到背景、光照、视角、姿态变化等因素的影响，且白天与黑夜两种工作模式下的图像存在模态上的差异；另外，不同监控场景下的图像域通常具有不一样的图像特征，当一个数据域中训练好的行人重识别模型，运用到新的数据域上时，模型性能会由于跨域而出现大幅度下降。针对这些问题，本文分别提出了一种三重注意力特征聚合的跨模态行人重识别方法、一种注意力校准的双分支跨域行人重识别方法，以及一种基于卷积自编码的跨域行人重识别方法。论文的主要研究内容总结如下： 1.在跨模态行人重识别领域，本文提出了基于三重注意力特征聚合的可见光-红外行人重识别网络。该网络首先利用空间维度和通道维度的特征相关性，挖掘不同模式下行人身体不同部位间的上下文关系；然后，利用图注意力机制分析可见光图像和红外图像间的关联性，学习增强的节点特征表示，并利用跨模态图级的上下文信息提高行人重识别的准确性。 2.在跨域行人重识别领域，本文提出了基于注意力校准的双分支跨域网络。该网络首先利用注意力校准策略改进了ResNet50网络，使其既能充分提取特征的通道信息和空间信息，又能解决特征不对齐问题；然后，引入域特定特征全局分支，用以提取域特定特征，并降低训练偏差；其次，引入域不变特征局部分支，用以获取源域互补信息；最后，利用实例归一化层从互补信息中提取域不变特征。 3.为进一步提高跨域行人重识别的准确率，本文提出基于卷积自编码器的跨域网络。该网络首先利用生成模型对网络特征进行重构，并结合原始特征计算散度损失和还原损失；然后，将统一聚合Bottleneck层引入域不变特征局部分支，并结合全卷积网络获取域不变特征；其次，利用全局平均池化层，提取全局上下文域引导特征；接下来，结合域不变特征和上下文域引导特征，用以获取最终的域不变特征；最后，在域不变特征引导分支和域特定特征全局分支后分别增加行人身份损失函数，对行人身份特征进行约束。

关键词

行人重识别/深度学习/注意力机制/特征聚合/卷积自编码

引用本文复制引用

授予学位

硕士

学科专业

控制工程

导师

朱松豪

学位年度

2022

学位授予单位

南京邮电大学

语种

中文

中图分类号

段落导航