面向低计算资源的度量学习小样本目标检测研究

陈志浩¹

扫码查看

作者信息

1. 河海大学
折叠

摘要

小样本目标检测是一种计算机视觉任务，旨在从具有极少标注样本的目标类别中准确地检测和定位目标对象。为提高在有限样本条件下的检测性能，现有小样本目标检测模型设计复杂，参数量在45M到100M之间，对设备的计算性能要求高，限制了小样本目标检测模型的使用场景。此外，受限于检测任务的复杂性，以及小样本中新类与基类的分布差异，小样本目标检测模型难以在样本稀少的条件下学习具有良好泛化性的特征表示，导致误检漏检问题和灾难性遗忘问题。本文基于泛化性能较高的度量学习，分别针对误检漏检问题和灾难性遗忘问题进行研究，寻求在更低的计算资源消耗下解决上述问题，以实现小样本目标检测模型的实际应用推广。主要工作如下: (1)当前小样本目标检测方法通过无监督方式挖掘支持图像和查询图像的关联信息来增强支持类别的特征表达，以降低误检漏检，但无监督方式的挖掘难以准确学习支持图像和查询图像的关联，不能充分降低误检漏检。为准确学习支持图像和查询图像的关联，降低误检漏检，在此基础上减轻模型的计算资源消耗，本文提出了基于监督注意力和特征重构的小样本目标检测方法SAFR。SAFR在定位阶段采用监督学习引导模型挖掘支持图像和查询图像的关联，提取更精确的建议区域，降低无监督方式的挖掘对误检漏检的影响。SAFR采用特征重构和度量学习，充分度量支持特征和建议区域的差异，在分类阶段降低建议区域的误检。为减少计算资源消耗，SAFR采用基于通道注意力的方式挖掘支持特征和查询特征的相关性，并去除对SAFR提升较弱的度量编码器。SAFR在PASCALVOC获得了次优平均AP50,为44.0％，在MSCOCO的30-shot中获得了最佳AP21.5％,对比其他模型获得了最佳AR,为30.7％(10-shot)和36.5％(30-shot),在计算效率对比中SAFR推理最快，占用计算资源最少，在实际应用场景获得最优。 (2)灾难性遗忘问题由模型参数冲突和基类新类数据分布差异引起，现有工作通过重播、对比学习和参数隔离的手段缓解灾难性遗忘，但未能同时考虑参数冲突和数据分布差异，且需要消耗额外的计算资源。本文提出了基于交叉卷积注意力和多维度量头的小样本目标检测方法CAMH,CAMH使用类无关的交叉卷积替代模型的高级语义学习过程，减少类相关参数，缓解模型参数冲突。CAMH基于度量学习减少模型对数据的依赖，缓解数据分布差异引发的灾难性遗忘。为减少模型的计算资源消耗，CAMH使用支持聚合模块降低交叉卷积的计算次数，并使用三个异构的编码器从高级语义、全局和局部的角度对特征进行更充分的编码与度量，相比原始的度量编码器也更加轻量。在PASCALVOC、MSCOCO和自建数据集DamDeficency的实验结果验证了方法的有效性，CAMH推理仅比最佳模型FCT的平均AP50低0.4％，为46.0％,在MSCOCO数据集上的30-shot获得了最佳AP22.7％,抗遗忘效果仅略低于FCT，且计算资源占用远小于FCT。

关键词

小样本目标检测/低计算资源/度量学习/交叉卷积注意力

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

周晓峰

学位年度

2024

学位授予单位

河海大学

语种

中文

中图分类号

段落导航