首页|基于多尺度特征融合和混合卷积自注意力的目标跟踪

基于多尺度特征融合和混合卷积自注意力的目标跟踪

尹鹏

基于多尺度特征融合和混合卷积自注意力的目标跟踪

尹鹏1
扫码查看

作者信息

  • 1. 南昌工程学院
  • 折叠

摘要

目标跟踪是计算机视觉领域中的重要研究课题之一,其目的是在连续的图像序列或视频帧中跟踪特定的目标,对目标的状态进行估计并预测目标在每帧中的准确位置。近年来,目标跟踪在精度和速度方面取得了重大进展。由于受到快速运动、低分辨率等因素的影响,建立有效的特征提取模型、构建鲁棒的特征融合网络模型以及设计一个高效且稳定的跟踪器仍然是一个具体挑战性的任务。在研究现有跟踪算法的基础上,结合深度学习、混合卷积以及自注意力等理论和方法,对特征提取网络和特征融合模型进行研究分析与改进。本文主要研究内容和成果如下: (1)提出一种基于多尺度层次化特征表示的目标跟踪算法。首先,在孪生神经网络框架中,通过将特征识别器分别嵌入在前三个卷积块之后,构建层次化特征提取网络模型。特征识别器生成三维注意图,对重要特征信息进行聚焦,以关注重要元素的位置和内容;并通过动态调整目标特征的权重,以获得强大的目标的特征,可以更好地处理快速运动、低分辨率以及尺度变化等问题,进一步提高了特征提取网络模型的表示能力。然后,构建双分支多尺度特征融合网络模型,在模板分支中,该模型将模板的特征集与编码特征作为输入。其中编码特征作为查询,与对应的模板特征集进行融合;在搜索分支,将搜索区域的目标特征与编码特征输入译码器,产生更加鲁棒的图像特征,使得跟踪器可以捕获模板与搜索分支之间复杂的非线性交互,进一步建立不同尺度特征之间的关联。最后,通过消融实验以及在多个测试基准上进行了充分评估,实验评估表明,该算法与最先进的算法相比具有优越的跟踪性能。 (2)提出一种基于混合卷积与自注意力聚合网络的目标跟踪算法。设计一个新的带有混合卷积和自注意力聚合模块的特征提取网络用于目标跟踪。首先,选择深度卷积和逐点卷积构建混合卷积,有效地将图像特征的空间混合与信道混合分离。自注意力使用相似度函数对输入特征进行动态计算,可以自适应聚焦于不同的区域,捕获更多的特征信息;通过自注意力来提高跟踪器的全局建模能力,以此构造一个基于混合卷积与自注意力的特征聚合模块,以增强特征的表示能力。该聚合模块能够有效地从相关特征图中提取局部与全局特征。然后,在聚合模块尾部添加一个随机失活层,用于缓解跟踪模型在训练过程中的过拟合现象,提升跟踪器的泛化能力。该算法充分利用了混合卷积与自注意力的优势,使得跟踪器更好地处理目标遮挡、运动模糊以及相似目标等因素对跟踪产生的影响,实现更精确的跟踪。实验结果表明,该算法在十个具有挑战性的测试基准上与最先进的跟踪算法相比,取得了优异的跟踪性能。

关键词

目标跟踪/特征提取/多尺度特征融合/混合卷积/自注意力

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

王军/朱飞勇

学位年度

2023

学位授予单位

南昌工程学院

语种

中文

中图分类号

TP
段落导航相关论文