摘要
科技的进步推动了数字信息化时代的发展。伴随着数字成像与存储设备和互联网的迭代与普及,使得人们可以快捷地获取、存储和传播数字图像。因此,如何从各种日益增长的数字图像库中快速、准确地检索到目标图像,成为了计算机视觉和模式识别领域经久不衰的研究热点。围绕这一研究内容,本文以彩色纹理图像为研究对象,从特征有机融合和深度学习两个方向出发进行相关的图像检索研究。其中,特征融合的目的是结合不同类型的底层特征得到对图像表达更全面的中层特征,使得到的特征更具有判别能力,它是图像检索手工方法中提升检索系统性能常用的方法;而使用深度学习方法提取得到的特征则更能表现出图像深层的本质特征,它是目前图像检索研究的热点。根据以上背景,本文在基于特征融合和深度学习的彩色纹理图像检索研究方面做了以下工作: (1)针对单一特征不能很好完整地表达彩色纹理图像信息的问题,提出一种结合具有互补性的颜色特征和纹理特征的图像特征提取方案,同时采用合适的闭式相似性测度以完成彩色纹理图像检索。在该检索方法中,首先在接近于人类视觉特性的HSV颜色空间中以非均匀量化的方式处理三个通道的数据并提取组合直方图形式的颜色特征;然后,在多尺度多方向Gabor复变换域提取V通道数据的子带幅值系数的Gamma分布参数特征以及相位系数的vonMises分布参数特征作为全局纹理特征,同时使用表征局部纹理信息更为充分的局部邻域差分模式(LocalNeighborhoodDifferencePattern,LNDP)算子提取V通道数据的局部纹理特征,并将所得到的颜色特征、全局纹理特征和局部纹理特征进行有机的融合。最后,采用合适的相似性测度,即颜色特征和局部纹理特征采用改进版本的曼哈顿(Manhattan)距离、由两种分布模型参数组成的全局纹理特征分别采用相应的K-L(Kullback-Leibler)距离,完成彩色纹理图像的检索。实验结果表明,融合颜色特征和纹理特征的图像特征提取方案可以有效地提高彩色纹理图像检索系统的性能。 (2)针对图像相位特征提取与利用不充分的问题,提出一种新的基于全局和局部(相对)相位特征融合的彩色纹理图像检索方法。该方法首次将局部引力角模式(PatternofLocalGravitationalForceAngle,PLGFA)作为局部相位描述符用于彩色纹理图像检索。具体来说,该方法首先在与人类视觉系统相接近的HSV颜色空间中采用改进的非均匀量化的方式提取组合直方图形式的颜色特征;然后,在Gabor复变换域针对V分量数据进行相对相位建模而提取全局纹理相位特征,同时利用PLGFA描述符在RGB颜色空间的灰度图像中提取局部纹理相位特征;最后,将这三种特征进行有机融合,并采取相应的闭式K-L距离和改进版本的曼哈顿距离,获得总的相似性测度,从而实现彩色纹理图像的检索。在四个标准数据集上的实验结果表明,该方法与现有方法相比具有较好的综合检索性能。 (3)针对现有基于深度学习的彩色纹理图像检索方法缺乏大型训练数据集和检索性能有待提高的问题,提出一种基于视觉Transformer网络模型,同时结合数据集构建与扩充的新方法。在该方法中,首先构建了一个具有75000幅彩色纹理图像的数据集,并在SwinTransformer最小的网络模型上进行迁移学习;然后使用四个经典的彩色纹理图像数据集作为目标数据集对网络模型参数进行微调,同时使用该模型进行特征提取;最后使用汉明距离作为相似性测度完成相关检索实验。在四个目标数据集上的实验结果表明,所构建的大型彩色纹理图像数据集具有较高的实用价值。同时,相关的实验结果还表明,合理的训练数据增强对网络模型性能的提升具有较好的帮助作用。