基于原型修正的小样本图像分类方法研究

李帅¹

扫码查看

作者信息

1. 延边大学
折叠

摘要

以深度学习为代表的人工智能技术已经在自动驾驶、环境监测、工业质检、计算机辅助医疗诊断等图像处理领域取得显著进展，对社会产生了深远的影响。这些成就依赖于从大量的、高质量的、有标注的数据集中进行监督学习。但是，在医学影像分析、农业和生物科学以及自动驾驶等领域，受限于成本、隐私保护、以及伦理安全等因素，难以收集到足够的有标注数据。在这类情况下，仅用少量有标注数据进行训练往往会引起过拟合，影响模型的性能。因此，小样本学习，即如何让深度学习模型通过对极少样本的学习使其具有良好的泛化能力，以缩减人工智能技术与人类思维间的鸿沟，成为了深度学习的一个研究重点和挑战。本文聚焦于小样本图像分类问题，开展了如下的相关研究工作: 首先，为解决如何获取充分的小样本图像浅层细节信息的问题，本文提出一种基于任务特定适配器的特征提取主干网络。该网络主干旨在增强浅层特征的空间特异性，从而生成更加丰富的浅层信息，通过这一过程，可以提取出更为有效的判别特征，从而使得分类器能够更好地理解图像内容，并实现更加准确的分类。其次，支持集中标注样本数量过少容易导致对原型向量的计算产生偏差，从而使得原型向量无法准确反映类别的整体分布。为了解决该问题，本文在特征嵌入阶段之后，引入了一个广度搜索模块。该模块深入挖掘数据间的内在联系，尤其是新类类别中支持集与查询集的样本特征之间的关系，寻找与支持集中每个原型最近邻的查询集样本特征，并基于这些特征计算分布信息，生成潜在样本。这些潜在样本用于对新类类别中支持集的数据分布进行精准修正，以动态调整原型向量，从而更精确地捕捉并表示每个类别的特征。最后，为使同类别特征间距更小，不同类别特征间距更大，以在基于度量分类时取得更好效果，引入无监督判别子空间模块对特征进行预处理。该模块首先利用结构化先验知识生成相似性矩阵和相异性矩阵。然后，利用相似性矩阵和相异性矩阵信息去计算出线性投影矩阵，作用于支持集、潜在样本和未标记查询集特征构建的子空间。这一过程可以有效地拉大不同类别之间的距离，使得不同类别的样本更加分散，同时也缩小同一类别内部样本之间的距离，使得同一类别的样本更加接近。这种预处理操作有助于提高模型在小样本图像分类任务中的分类性能和泛化能力。对比实验结果表明，本文提出的基于原型修正的小样本图像分类算法能有效提高小样本图像分类准确率。相比于基线EASY模型，在miniImageNet数据集5-way 1-shot 和5-way 5-shot设置下，分别提高了3.47％和2.10％;在FC100数据集5-way 1-shot 和5-way 5-shot设置下，分别提高了3.23％和2.44％;在tiered-ImageNet数据集5-way 1-shot 和5-way 5-shot设置下，分别提高了2.94％和 1.81％。消融实验结果表明，本文所做的改进可以有效缓解小样本图像分类中存在的问题。

关键词

图像分类/小样本学习/原型修正/任务特定适配器/广度搜索/线性投影

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

金璟璇

学位年度

2024

学位授予单位

延边大学

语种

中文

中图分类号

段落导航