基于深度学习的无监督领域自适应图像分类算法研究

谭茜成¹

扫码查看

作者信息

1. 四川师范大学
折叠

摘要

领域自适应是指特征空间和类别空间相同但数据特征分布不同的一种特殊迁移学习方法。它通过把特征分布不同的源域和目标域的数据，映射到一个特征空间中，使其在该空间中的距离更近，最后达到源域训练的模型能较好适用于目标域的目的。在领域自适应学习中，源域数据均提供标签，并根据目标域是否存在标签将其划分为监督、半监督、无监督三种情况。由于实际生活中大量存在的是无标签数据，因此目前主流的研究方向是无监督领域自适应，而源域与目标域特征分布不同出现的域偏移是其研究重点。为更好缓解域偏移情况，本文基于深度学习对无监督领域自适应的图像分类算法展开了以下研究工作：（1）针对特征通道交互性弱以及决策边界附近出现大量混淆数据导致错误分类的问题，本文构建了基于核范数优化的多表征挤压激励自适应网络模型（Multi-RepresentationSqueeze-ExcitationAdaptationNetworkModel，MRSEAN）。首先通过融合多表征特征提取层和挤压激励注意力机制对域不变特征进行特征重标定，强化重要表征特征的表达，并采用最小化条件最大均值差异（ConditionalMaximumMeanDiscrepancy，CMMD）的方式，对齐源域与目标域条件特征分布，之后对目标域分类输出矩阵的核范数最大化，实现对决策边界周围游离的混淆数据的约束。实验结果表明，MRSEAN模型较于当前主流模型在图像分类精度上有明显提升。（2）针对标签数据常来自具有不同分布的多个源域而不是单一源域以及无法充分挖掘数据集域不变特征的问题，本文将MRSEAN拓展为多源域下的多表征扩张自适应网络模型（Multi-RepresentationDilationAdaptiveModelinMulti-SourceDomain，MMDAN）。首先构造多表征扩张卷积层，实现数据空间层级化信息提取；再最小化多个源域分类器输出的曼哈顿距离，减小多个源域分类器对目标域数据的判别分歧，最后分别对经过每一组源域分类器的目标域输出矩阵进行决策边界混淆数据约束，而后采用均值计算输出目标域的预测标签。通过域适应实验结果表明，MMDAN模型较于当前主流模型在图像分类精度上有明显提升。（3）针对现实应用场景中，多个源域数据集进行预训练时，出现特征提取局限性和源域数据不可用的问题。本文将MMDAN拓展为无源域下基于Transformer的自适应网络模型（Transformer-basedSource-freeadaptivenetworkmodel，SFTAN）。首先，在预训练层将基于CNN构造的ResNet50模块与VisionTransformer以串联方式连接，通过在层级更新特征向量，实现全局和局部信息均衡建模；其次利用源域数据有监督地训练出多个模型，最小化条件熵并同时计算得到各源域模型的最佳迁移权重来实现源域分类器的加权聚合，再通过对目标域数据的聚类质心进行加权求和，将目标域数据准确分配到对应质心，实现对目标域数据的分类。通过实验数据表明，SFTAN模型相对于主流的源域数据可用的模型，其精度只产生略微下降，与其他主流无源域数据的无监督领域自适应方法相比，分类精度有显著提升。

关键词

无监督领域自适应/深度学习/迁移学习/图像分类算法

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

郭涛

学位年度

2022

学位授予单位

四川师范大学

语种

中文

中图分类号

段落导航