摘要
行人再识别(Re-ID)技术一直是计算机视觉和模式识别领域的关键任务。一般将该技术视为图像检索的子集,行人再识别是一种特定的识别技术,其旨在给定特有行人在跨摄像头视频或图像中定位该特定行人。该技术通常结合人脸识别、行人追踪等技术,结合应用于视频监控和智能安防领域。 在基于伪标签预测的跨域行人再识别方法中,模型的性能较大程度上依赖于伪标签的质量,并且聚类产生的离群点包含了丰富的知识。急需解决的一个问题是如何在迭代训练中提升伪标签的质量、如何利用丰富的离群点。其次,挖掘更准确的正样本以提升模型的学习能力一直是行人再识别算法中的常用做法,如何使模型挖掘更加精确地正样本,并设计模型框架和损失函数提升模型学习鉴别性特征的能力是另一个难题。 针对上述第一个问题,本文首先提出一种基于多聚类的跨域行人再识别算法。该算法利用多种聚类算法分配伪标签,为每个样本生成多伪标签,并且为离群点重新分配伪标签,结合多分支网络,在迭代过程中逐步提升伪标签质量和模型的识别性能。针对上述第二个问题,本文在多聚类的跨域行人再识别框架的基础上,提出一种联合正样本挖掘与多聚类的跨域行人再识别算法。该算法基于数据增强技术,通过结合伪标签和交叉选择挖掘正样本,在迭代过程中逐步提升模型的学习能力。总之,本文的主要贡献如下所示: (1)本文提出了一种基于多聚类的跨域行人再识别算法,以解决在迭代训练过程中标签质量不高的问题。首先,使用有标签的源数据集(sourcedataset)训练基础模型,利用基础模型提取无标签样本的全局特征和局部特征;然后,计算特征对之间的距离,对不同的特征使用不同聚类算法并分配伪标签;其次,将离群点分配给最相似的簇;最后,使用伪标签作为监督信息,进行监督学习,从而实现模型的跨域识别能力。实验结果表明,本文提出的基于多聚类的跨域行人再识别算法能够取得较佳的识别效果。 (2)本文提出了一种联合正样本挖掘与多聚类的跨域行人再识别算法,以解决挖掘正样本提升模型学习鉴别性特征的能力。首先基于多聚类的跨域行人再识别框架,将网络划分为原始分支和增强分支;然后利用交叉选择方式选择正样本;最后,结合伪标签和选择的正样本训练模型,直至深度模型稳定。实验结果表明,本文提出的联合正样本挖掘与多聚类的跨域行人再识别算法在评估指标上能够取得明显的提升。