计算机技术与发展2022,Vol.32Issue(12) :12-20.DOI:10.3969/j.issn.1673-629X.2022.12.003

基于视觉一致性增强的细粒度图像检索

Fine-grained Image Retrieval Based on Strengthened Visual Consistency

郎文溪 孙涵
计算机技术与发展2022,Vol.32Issue(12) :12-20.DOI:10.3969/j.issn.1673-629X.2022.12.003

基于视觉一致性增强的细粒度图像检索

Fine-grained Image Retrieval Based on Strengthened Visual Consistency

郎文溪 1孙涵1
扫码查看

作者信息

  • 1. 南京航空航天大学 计算机科学与技术学院,江苏 南京 211106
  • 折叠

摘要

细粒度图像检索旨在从大类图像中检索出特定子类的图像.得益于卷积神经网络的快速发展,细粒度图像检索的精度和速度均取得突破,但其性能仍受限于不同子类图像间高相似性和同一子类图像间的高差异性.针对上述问题,该文提出了一种基于对比学习和视觉一致性增强的细粒度图像检索框架CVCS-Net.CVCS-Net由判别性特征挖掘模块、视觉一致性增强模块和语义哈希编码模块组成,在挖掘类间图像判别性特征的同时,通过增强类内图像的视觉一致性来提升模型对类内图像差异的容忍度.判别性特征挖掘模块学习空间注意力图来定位图像的判别性区域并获得这些区域对应的局部特征表示;视觉一致性增强模块提升模型对类内图像差异的鲁棒性;而语义哈希编码模块基于量化损失和位平衡损失进一步学习紧凑的哈希码用于检索.CVCS-Net在CUB200-2011、Stanford Dogs和Stanford Cars的mAP分别可达到0.8591、0.8564和0.9183,相较于当前其他检索方法能够取得更好的检索结果.

关键词

细粒度图像检索/弱监督/对比学习/哈希/视觉一致性

引用本文复制引用

基金项目

国防科技创新特区项目()

中央高校基本科研业务费专项(NZ2019009)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量1
参考文献量7
段落导航相关论文