摘要
计算机视觉技术随着科技的快速发展,正越来越受到各行各业的关注和应用。目标跟踪是计算机视觉中的重要研究方向之一,并被广泛应用在人机交互、视频编辑以及军事侦察等。在复杂的场景下,被跟踪目标其周围环境的快速变化等是未知的,因此需要针对不同的应用场景对算法优化和改进。尽管面临着巨大的挑战,许多研究者已经在目标跟踪领域取得了许多重要的成果,并且在实际应用中取得了良好的效果。由于其高准确性、实时性和灵活性,基于孪生网络的目标跟踪算法已经变得越来越受欢迎,并且在跟踪准确度和实时性等方面都取得了较好的性能。 本文针对一些现有孪生网络目标跟踪算法的不足之处(无法很好的处理尺度变化以及部分遮挡等外观变化的影响),通过结合深度学习技术提出不同的解决方案。本文的主要创新成果如下: (1)提出一种基于空间一致性匹配与特征权重学习的目标跟踪算法。设计了一种基于克罗内克积匹配(Kroneckerproductmatching,KPM)的特征融合网络,通过计算目标模板和搜索区域图像的空间布局概率对应关系,极大地缓解目标外观变化的影响,如尺度变化、部分遮挡和目标旋转等。基于KPM的特征融合网络建立目标模板和搜索图像之间的空间区域对应关系。然后,获取模板特征和搜索区域特征的空间信息,进行更准确的相似度计算。此外,在模板分支中引入了基于归一化的注意力模块(NAM),有效地抑制了背景信息,并突出了目标特征。大量实验表明,该算法在实时跟踪速度下的有效性和泛化能力,并在GOT-10k数据集上获得63.7%的平均重叠率(AO)。 (2)提出一种基于无批次重参数卷积与特征滤波的目标跟踪算法。首先,设计一种基于无批次重参数卷积的特征提取子网络,增强目标特征提取能力以及防止网络模型退化等问题。无批次重参数卷积通过在卷积重参数过程中嵌入无批次归一化层设计所得。该子网络在通道维度上对特征进行缩放,在增大感受野的同时,获得了更丰富的通道信息,提取强大的目标特征并进行特征融合。本文还设计了一种基于特征滤波的特征融合网络,用于获取互相关操作所忽略的全局空间信息,获取高质量融合特征。基于特征滤波的特征融合网络将模板和搜索区域特征在全局空间背景下进行融合,通过增强重要特征和过滤冗余特征,获得高质量的融合特征。实验结果表明,与先进的跟踪算法相比,所提出的算法达到了45FPS的跟踪速度,并在OTB数据集上获得了92.1%的精确度以及70.5%的成功率。