首页|YOLOv3和双线性特征融合的细粒度图像分类

YOLOv3和双线性特征融合的细粒度图像分类

Fine-grained classification based on bilinear feature fusion and YOLOv3

扫码查看
目的 细粒度图像分类是计算机视觉领域具有挑战性的课题,目的是将一个大的类别分为更详细的子类别,在工业和学术方面都有着十分广泛的研究需求.为了改善细粒度图像分类过程中不相关背景干扰和类别差异特征难以提取的问题,提出了一种将目标检测方法YOLOv3(you only look once)和双线性融合网络相结合的细粒度分类优化算法,以此提高细粒度图像分类的性能.方法 利用重新训练过的目标检测算法YOLOv3粗略确定目标在图像中的位置;使用背景抑制方法消除目标以外的信息干扰;利用融合不同通道、不同层级卷积层特征的方法对经典的细粒度分类算法双线性卷积神经网络(bilinear convolutional neural network,B-CNN)进行改进,优化分类性能,通过融合双线性网络中不同卷积层的特征向量,得到更加丰富的互补信息,从而提高细粒度分类精度.结果 实验结果表明,在CUB-200-2011(Caltech-UCSD Birds-200-2011)、Cars196和Aircrafts100数据集中,本文算法的分类准确率分别为86.3%、92.8%和89.0%,比经典的B-CNN细粒度分类算法分别提高了2.2%、1.5%和4.9%,验证了本文算法的有效性.同时,与已有细粒度图像分类算法相比也表现出一定的优势.结论 改进算法使用YOLOv3有效滤除了大量无关背景,通过特征融合方法来改进双线性卷积神经分类网络,丰富特征信息,使分类的结果更加精准.

闫子旭、侯志强、熊磊、刘晓义、余旺盛、马素刚

展开 >

西安邮电大学计算机学院,西安710121

西安交通大学电信学院,西安710049

空军工程大学信息与导航学院,西安710077

细粒度图像分类 目标检测 背景抑制 特征融合 双线性卷积神经网络(B-CNN)

国家自然科学基金国家自然科学基金国家自然科学基金

617034236147330961379104

2021

中国图象图形学报
中国科学院遥感应用研究所,中国图象图形学学会 ,北京应用物理与计算数学研究所

中国图象图形学报

CSTPCDCSCD北大核心
影响因子:1.111
ISSN:1006-8961
年,卷(期):2021.26(4)
  • 8
  • 6