基于原型网络的小样本学习及其鲁棒性研究

李思蕊¹

扫码查看

作者信息

1. 广州大学
折叠

摘要

近年来,小样本学习受到越来越多的关注并取得了重大进展.与大规模监督的深度学习不同,小样本学习旨在从少数带有标记的样本中学习样本特征,通过假设每个类别只包含一些标记样本,来构建准确的机器学习模型.显然,小样本学习更符合人脑的视觉认知机制.原型网络是一种简单、易懂、高效的小样本学习网络,基于嵌入的思想,首先通过将样本映射到一个空间并计算每个类别样本的中心,在进行分类时,通过对比目标到中心的距离以推断结果.由于原型网络仅从每个类的少数标记样本中学习原型表征,因此它对于小样本分类是有效的,并且已广泛应用于计算机视觉、自然语言处理等许多领域.然而,原型网络仍存在以下缺陷:(1)当数据集的视觉外观复杂,支持集和查询集的分布差异很大时,原型网络都难以建立支持集和查询集之间的关系,而使得其性能下降.(2)如果某些标记样本不幸被损坏或是被噪声污染,则某个类的原型表征将严重偏移,原型网络也难以保持其鲁棒性.为了克服这些缺陷,本文提出两种改进原型网络的方法,通过应用余弦注意力机制有效处理视觉外观复杂的样本,使其能更好地完成小样本学习任务,以及通过搭建自适应重加权鲁棒框架,来抵抗噪声样本的干扰使其有较高的鲁棒性.具体工作如下: (1)提出了基于余弦注意力机制的小样本学习原型网络(CPNet).当数据集样本的视觉外观复杂,并且支持集和查询集的分布也存在极大差异时,传统的原型网络的训练过程往往只关注困难任务,无法将支持集上学到的知识准确的应用于查询集上.为解决这一问题,本文设计了针对小样本任务特有的余弦注意力机制,来替代传统的缩放点积机制.首先,在计算原型表征阶段引入了可学习的参数以解决原型网络只关注困难任务的问题,然后,通过计算余弦相似度来提高支持集和查询集特征在Transformer层映射的准确性,使其能产生更稳定和有效的映射关系,以增强支持集与查询集中具有相同特征样本之间的相关性.通过在1-shot和5-shot的不同小样本学习任务实验设置下,证明了提出的CPNet在miniImageNet,CUB-200以及CIFAR-FS数据集上的优势.特别的是,在视觉外观复杂的瑜伽姿势识别数据集上,进行了对比试验,展示了CPNet在数据分布差异极大的场景下,仍能保持优秀的学习能力. (2)提出了基于自适应重加权的对抗鲁棒原型网络(AR2PNet).鲁棒重加权原型网络(RRPNet)是一种提高原型网络(ProtoNet)鲁棒性十分有效的方法.然而,当自然样本极少并且噪声难以分辨时,RRPNet的性能就会受到限制.为了解决这一问题,并没有采用RRPNet中直接计算naiverepresentations之间相似度的方法,而是计算prototyperepresentations之间的相似性以获得最终的原型表征,这一方法强调了类间样本之间的关系,大大减少了计算成本并有效的提高了模型预测精度.同时,为了使模型拥有抵抗对抗样本干扰的能力,将损失函数表述为一个极小极大问题,其灵感来自于AT.在CIFAR-FS和MiniImageNet数据集上进行了不同小样本学习设置下的实验,并且实验结果证明了该模型在应对对抗攻击时的鲁棒能力.此外,还进行了消融实验以进一步解释本文方法.在不同的小样本学习设置中,其方法在准确性、鲁棒性和计算开销都优于RRPNet.

关键词

原型网络/小样本学习/余弦注意力机制/自适应重加权/对抗训练

引用本文复制引用

授予学位

硕士

学科专业

网络空间安全

导师

王显珉

学位年度

2024

学位授予单位

广州大学

语种

中文

中图分类号

段落导航