摘要
目标检测作为计算机视觉中的重要分支之一,在如今的日常生活和工业生产中均被广泛应用。然而,在实际应用中目标检测模型多基于全监督学习方法,检测性能好的全监督目标检测模型需要大量高质量、高规格边界框标注的数据,收集此类数据会耗费大量的人力和物力。针对目标检测任务,基于弱监督学习方法的模型训练时只需要图像级别标注,比全监督学习更节约成本。本文基于此出发点,对弱监督目标检测展开一系列相关研究。主要工作如下: 针对多实例学习会导致模型检测物体时易陷入局部最优解的问题,提出一种基于坐标注意力机制的弱监督目标检测模型。通过添加坐标注意力机制模块增强网络的定位能力,该模块使得模型能够获取图像中和待检测物体相关度更高的特征信息,从而更准确的定位物体,缓解了模型易陷入局部最优解的情况。实验结果表明,相较于单阶段弱监督目标检测模型PCL而言,在平均准确率和定位准确率上分别提升了5.1%和1.8%。 考虑到双阶段弱监督目标检测模型的检测精度易受单阶段生成的伪标注影响,本文提出了一种联合优化损失策略并设计了一种端到端的弱监督目标检测模型,以端到端的方式联合训练伪标注的生成和FastRCNN分支,从而避免实例分类器过度拟合图像中物体的局部区域,在提高模型检测性能的同时减少了训练时间。实验结果表明,联合优化损失策略和FastRCNN分支进一步提升了模型的分类精度和定位精度。与双阶段弱监督目标检测模型PCL-Ens+FRCNN相比,平均准确率提升3.3%,定位准确率提升2.3%。