摘要
近年来人工智能领域发展迅速,深度学习算法模型在视觉、自然语言以及音频信号等领域已经逐步投入生产实践应用,并展现出卓越的性能。然而目前深度学习算法模型仍然依赖大规模的数据量作为支持,在数据稀缺的领域中无法直接应用。为了解决上述问题,少样本学习逐渐成为深度学习领域研究的热点,一些自然图像少样本分类方法应运而生,但分类性能上仍然与数据充足条件下的深度学习方法存在差距。同时,少样本图像分类方法在医学图像领域的拓展仍然面临困境。医学图像收集困难,在数据标注过程中需要专业人员的支持,难以获取大量的标注样本,并且医学图像与自然图像在数据域上存在偏移问题,往往无法直接将自然图像少样本分类方法应用于医学图像分类任务中。 本文针对上述问题进行研究,主要考虑如何提升深度学习算法模型在自然图像少样本分类任务中的分类性能以及如何将少样本图像分类方法拓展到医学图像分类任务中。本文的研究内容如下: (1)针对深度学习中样本稀缺造成的分类性能下降的问题,本文提出了一个基于对比学习的两阶段少样本图像分类方法ESACNet。ESACNet采用了主流的元学习范式,包含预训练阶段和元训练阶段。先验知识对模型学习过程有积极影响,因此预训练阶段采用自蒸馏作为知识迁移策略,训练模型快速学习特征子集,以提高模型产出特征的泛化性和可迁移性。少样本条件下,样本相似性信息占据模型学习的主导地位,因此元训练阶段基于对比学习,采用擦除-洗牌算法调整样本特征以构建难样本,迫使模型学习更多的特征差异性信息,强化对比学习性能。此外,针对少样本图像分类中常见的支持-查询偏移问题,本文设计了特征修正模块,通过注意力机制修正样本特征,降低支持-查询偏移对分类性能造成的影响;针对少样本学习对不同少样本任务的适配问题,本文设计了任务适配模块,通过将任务中样本特征投影到新的特征空间来快速学习和适配不同的任务。在四个公开少样本数据集上的实验结果证明了 ESACNet在自然图像分类任务上的有效性。 (2)针对自然图像到医学图像跨域条件下的模型迁移问题,本文提出了一个结合自监督任务的跨域少样本医学图像分类方法SimMargin。SimMargin方法可以结合自然图像少样本分类模型,通过迁移学习形式进行跨域学习,并充分利用少样本任务中的无标注数据。具体来讲,SimMargin利用多级分类对支持集样本进行学习,使用辅助分类损失从多个层次优化模型,充分挖掘医学图像中的不同层次特征,使训练过程能从多个层次关注样本的异同性,有利于模型的迁移过程;为了充分利用无标注数据进行知识迁移,设计了自监督旋转拼图代理任务,以及变换一致性对比任务,通过两种任务使模型学习给定医学图像域的相关特征,充分强化模型在医学图像少样本任务上的特征鲁棒性。本文将SimMargin与若干经典少样本分类算法模型结合,在公开医学图像数据集上的实验表明了 SimMargin在跨域医学图像少样本分类任务中的有效性。