摘要
在计算机视觉中,图像分类作为一个任务大类,在各行各业中都发挥着重要的研究需要以及多样化的应用场景。而细粒度图像分类在计算机人工智能领域掀起了一股热潮,细粒度图像分类是指将高度近似的类别之间实现更加精细的类别划分,通过聚焦于区分相同大类下的多个不同子类,将其下的不同对象进行区分开来。细粒度图像分类的难点在于类间内部存在的差别十分细微,而类内因为姿态等不确定因素,使得细粒度图像分类变得更加艰难,传统的神经网络难以捕捉到图像间细微的特征容易造成分类错误。同时数据收集困难导致获取的图像样本量少,而现有的方法依赖大量数据集的驱动训练可以完成细粒度图像分类,但在小样本数据上无法很好的完成细粒度图像分类。使得细粒度图像分类更具挑战性。 鸟类是人类赖以生存的生态系统的重要组成部分,云南独特的环境也孕育了珍稀野生鸟类,本文以此来构建珍稀野生鸟类小样本数据集,基于细粒度图像分类类间差别小、类内差别大的特点和样本数据量少的特点,本文通过从增强样本、提取局部特征和建立数据特征之间关系的维度展开实验,提出改进了两个基于深度学习的细粒度图像分类方法,主要包括以下三个方面工作: (1)针对于细粒度图像分类中类间差距小,类内差距大的特点,本文提出了一种基于Vision Transformer的多尺度特征融合的细粒度图像分类方法。该方法使用一种两分支网络架构,由全局分支和局部特征融合分支组成。整个区域内提取特征,获取更多细粒度特征后进行融合,从而使得模型从这些潜在特征区域内挖掘更多的细粒度特征。实现细粒度图像分类任务有利于解决神经网络无法聚焦于细粒度图像间的细微差异的问题。将局部特征与全局特征相结合,实现细粒度图像分类,提高准确率。 (2)针对细粒度图像分类样本数量少的特点,本文提出了一种基于图神经网络的小样本细粒度图像分类方法。该方法通过网络模型提取到的特征,将其送入到图神经网络进行处理,以特征进行构建边和点,不断更新变化节点特征和边特征,从而提高模型的准确率。将本文的改进方法在基准数据集上进行验证对比,可以看出与其他模型相比能取得较好的效果。在目前公开的细粒度图像分类领域中,基于现实条件构建了模型训练所需的云南珍稀野生鸟类图像数据集。通过拍摄和互联网图片搜集两种方式进行图像的采集,对珍稀野生鸟类图像进行整理分类,并对图像进行预处理操作,在一定程度上改善了模型训练过拟合的情况。并将其用在云南珍稀野生鸟类数据集上训练验证所改进方法的有效性。 (3)在以上改进方法的基础上,通过构建一个珍稀野生鸟类小样本数据集,设计实现了一款细粒度鸟类识别分类系统。提供了一种便捷简易的可视化识别分类方法,为实际工作中的图像分类应用提供帮助。