摘要
目标跟踪作为计算机视觉中的一个热点问题,广泛应用于虚拟现实、自动化监控和无人机侦察等众多领域。近年来,基于深度学习的目标跟踪研究取得了很大进展,但是,一方面由于目标跟踪场景的复杂性,如存在背景遮挡、低分辨率以及目标姿态的变化等,极大地限制了目标跟踪的速度和精度;另一方面现有的深度网络为了获得更好的性能而变得更深、更慢,大多只适用于理想环境下的实时目标跟踪,依赖于多尺度搜索方案或预定义的锚框来准确估计目标的尺度和纵横比,影响模型的性能。为解决预定义的锚框所带来的影响,以及在低分辨率、光暗变化、遮挡等场景下跟踪鲁棒性较差的问题,并在准确性和实时性之间取得更好的平衡,本文将基于孪生网络对目标跟踪算法进行深入研究。具体工作如下: (1)提出了一种基于双重注意力机制的目标跟踪孪生网络,解决了在低分辨率、尺度变化、遮挡、形变等场景下目标跟踪的鲁棒性差的问题。首先,为提高模型的特征提取能力,提出了基于注意力机制的特征增强方法,将特征提取网络与双重注意力机制相结合,通道注意力和空间注意力相结合,通过在通道和空间维度上具有不同风格的注意力模型来分离增强的特征图,使得模型能够更有效地捕获特征信息;其次,引入注意机制使网络聚焦于不同尺度特征图的关键信息,增强对目标关键信息的学习,进一步缓解复杂场景带来的干扰;同时通过构建深度可分离卷积模块,利用多个通道之间的关系,提取更丰富、更准确的鲁棒特征表示;然后,将分类、回归分支分别进行卷积操作,经过训练后的分类分支最终得到模板帧中各区域是正样本还是负样本,回归分支可分别得到各个锚框与搜索帧中边界框的相对位置差;最后,在三个公共数据集上对该方法进行实验验证,结果表明该网络具有良好的效果,并且有效提升了目标跟踪的性能。 (2)提出了一种基于目标类别质量评估的无锚框孪生网络,解决了直接使用分类置信度进行边界框选择会导致性能下降问题。首先,在上一问题的基础上,为解决预定义锚框导致的鲁棒性降低问题,构建了无锚框的目标跟踪方法,使得跟踪器能够分别执行分类和状态估计,将目标与背景或干扰因素有效分离,提升了鲁棒性;随后,提出了一个具有目标类别质量评估分支的跟踪头,通过在分类分支中引入目标类别质量评估分支,进一步提高边界框位置回归的准确性;然后,由分类分支得到模板帧中各区域的正负样本,回归分支得到各个锚框与搜索帧中边界框的相对位置差。最后,通过实验验证表明在单目标跟踪数据集上的各项指标与目前主流算法对比具有显著的优越性,同时可以保持较高的准确性和实时性。