摘要
行人重识别是图像检索的子问题,其目的是检测特定的行人是否曾经出现在其它摄像机中。行人重识别面临着一系列复杂的问题,如模型对不同分辨率的行人图像不具有鲁棒性,开放场景中行人的状态变化大,光照条件差,行人被遮挡等,是一个具有挑战性的课题。本文选择无监督域适应领域作为研究方向,该方向的研究方法大体分为基于聚类伪标签方法和基于域风格迁移方法。针对现有的域适应模型对图像细节信息利用不充分和不同域间数据分布差异问题,设计了一种基于风格迁移与知识蒸馏的行人重识别算法。本文主要研究内容和创新点如下: (1)域适应行人重识别算法中存在着对细节信息利用不充分的问题。局部特征更加关注行人的细节信息,可以有效帮助模型识别相似的困难样本。本文设计了非对称多粒度网络作为骨架网络,获取行人的特征,具体是指通过全局平均池化和全局最大池化获取相对应的特征,保持全局平均池化分支特征完整性的同时,在图像的高度上对最大池化分支进行平均分割,获取样本的局部特征。针对不同通道和空间位置上样本特征所包含的语义信息的差异,本文在残差网络中嵌入了通道注意力和空间注意力级联的注意力机制模块,进一步挖掘图像的细节信息。 (2)不同域间数据分布差异阻碍了模型自适应能力的提高。域风格迁移方法可以生成与目标域风格类似的图像,同时很好地保留原始样本间的关系。本文设计了域风格迁移与基于知识蒸馏的教师学生网络相结合的方法。域风格迁移方法生成与目标域风格类似的源域样本,用于源域模型的训练,可以使模型提前获取目标域样本的数据分布,并在教师学生网络模型的相互促进下,提高模型的域适应能力。 (3)基于聚类伪标签的域适应方法存在着噪声伪标签问题。为此,本文设计了伪标签精炼和动量对比损失处理噪声伪标签。伪标签精炼将教师网络输出的分类概率和样本特征作为监督信息,训练学生网络,减小聚类硬伪标签带来的误差。动量对比损失包含一个任意长度的队列,最大限度的选取负样本,缓解噪声伪标签的影响。 本文在Market-1501和DukeMTMC-reid数据集上进行了对比实验和消融实验,验证了各模块的有效性,且与主流方法相比,本文方法具有一定的先进性和竞争力。