摘要
针对细粒度图像类别之间差异较小的问题,需要对不同区域进行特征提取,自注意力模型能够有效地获取全局特征,卷积神经网络有利于得到图像的局部细节特征.为了实现高效的图像特征提取,提出一种融合自注意力和卷积的图像检索方法.自注意力和卷积是特征提取的两种强有力的方法,将两者进行有效融合,以提取更鲁棒的特征.该方法先通过卷积层提取图像局部特征,然后再输入到自注意力模型捕获全局信息,生成质量更高的图像特征用于图像检索.为了使自注意力模型与卷积能够有效融合,对自注意力模型进行了改进,更好地将局部特征与全局表示进行融合,实现改善图像检索效果的目的.在CUB-200-2011 及CARS196 图像检索数据集上的实验结果表明,所提方法可以有效地提高检索精度.
基金项目
北京市教育员会科学研究计划(110052971921/021)