近年来人们已经创建了几个用于视觉跟踪研究的基准数据集.尽管它们有用,但它们是否足以理解和诊断不同跟踪算法的优点和缺点仍然值得怀疑.为了解决这个问题,文章提出了一个框架,将跟踪算法分解为五个组成部分,即运动模型,特征提取器,观察模型,模型更新器和集合后处理器,以研究它如何影响整体的结果.令人惊讶的是,我们的研究结果与视觉跟踪研究界的一些共识存在差异.我们发现特征提取在跟踪中起着最重要的作用.另一方面,尽管观察模型是许多研究的焦点,但我们发现它通常没有带来显著的改善.此外,运动模型和模型更新程序包含许多可能影响结果的细节.此外,当组成的跟踪算法具有高度多样性时,集合后处理器可以显着改善结果.根据我们的研究结果,我们整合了一些非常基本的构建模块,构造了一个基本跟踪算法,该跟踪算法在性能上与最先进的跟踪算法相比具有竞争力.