摘要
图像识别是计算机视觉研究领域中核心的研究方向之一,可分为一般图像识别和细粒度图像识别。一般图像识别指识别不同类型的物体,如车、人、狗等;细粒度图像识别指识别同一大类物体中的不同子类,如不同种类的鸟、不同型号的车等。相比一般图像,细粒度图像因类间特征差异小、类内特征差异大和目标在图像中占比较小等数据特性而难以识别。虽然目前的细粒度图像识别算法虽然已经获得了一定的识别效果,但是现有方法都是利用包含大量背景信息的整幅图像特征进行识别,同时忽略了颜色形状等浅层可区分性特征在细粒度图像识别中的作用,导致识别精度不高。针对这些问题,本文提出了基于卷积神经网络的细粒度图像识别方法,并进行了详细的分析和实验。具体研究内容包括以下几点: 首先,针对现有方法忽略浅层特征对细粒度图像识别的作用问题,本文提出了基于特征融合的细粒度图像识别方法。通过分析浅层特征对细粒度图像识别的重要作用,提出了自适应权重的特征融合方法。利用该方法融合浅层和高层语义特征进行识别,充分发挥了浅层特征在细粒度图像识别中的作用。此外提出的方法不改变模型参数的数量级且可迁移性强。相关实验结果验证了提出方法的有效性。 其次,针对现有方法仅利用包含大量背景噪声信息的整幅图像特征进行识别问题,本文提出了基于多分类损失函数的细粒度图像识别方法。通过分析单一图像特征识别的弊端和多层级(包括图像级、目标级、像素级)特征识别的优势,利用不同层级特征设计多分类损失函数进行多粒度识别的方法。提出的方法仅在图像类别标签信息下进行弱监督学习,促使网络关注和学习多层级信息,获取区分性的细粒度特征,提升识别精度。 最后,本文将特征融合的识别方法和基于多分类损失函数的方法进行融合和优化,提出了基于多层级融合学习的细粒度图像识别方法。该方法利用自适应权重融合目标区域的不同的特征信息。实验结果表明提出的方法进一步提升了细粒度图像识别正确率。