近年来,深度学习由于其突出的特征表达能力,推动了目标跟踪领域的发展.但在复杂视觉场景下,如当目标尺寸变化与目标遮挡时,由于特征信息的缺失,目标跟踪器容易产生漂移,导致目标丢失.首先探究一种经典的基于目标检测的跟踪算法ROLO,ROLO采用长短期记忆网络(LSTM)处理视频帧序列并进行跟踪,但该算法在复杂场景下易产生跟踪漂移、丢失.对此,基于日益成熟的目标检测算法,使用检测器对视频进行逐帧检测,定位感兴趣的目标,将目标跟踪问题转换为目标在不同帧中的关联问题,并设计一款基于IOU匹配的跟踪器.实验结果表明,该方法相比ROLO更加简洁,具有更强的鲁棒性,处理速度也更快,在对实时性要求较高且算力有限的条件下具有一定应用价值.