摘要
随着智慧医疗信息化建设的加快,深度学习方法在计算机辅助诊断技术中越来越受到重视。深度学习模型的训练需要大量的有标签数据去支撑,然而在医学图像分类领域中完备的有标签数据集十分稀缺。采用迁移学习的方法来应对标签数据短缺的问题已取得不错的效果,但是自然图像和医学图像之间的特征分布存在很大的差异,这在模型迁移的过程中会对医学图像的分类准确率产生影响。采用自监督学习做模型预训练,可以减少模型对标签数据的依赖,也不用顾虑不同图像域存在特征分布的差异。自监督学习只需要少量有标签数据和大量无标签数据即可让模型获得不错的分类准确率,其利用大量无标签数据做模型预训练,然后在少量有标签数据上做微调,这样做大大降低深度学习方法对大型的有标签数据的需求。但是当前自监督学习方法在医学图像分类诊断领域的研究发展尚未成熟,仍存在可提升空间。因此本文针对有标注医学图像分类数据集稀缺的问题,以及自监督学习方法在其中的应用展开深入研究。主要研究内容如下: 1.本文提出了基于困难负样本对比学习的新冠肺炎检测算法(FastMixingContrastiveLearning,FMixCL)。医学图像在临床采集中受光照环境、设备参数、患者自身等因素影响成像结果有很大的不稳定性,FMixCL通过多种图像增强方法能让模型学习到医学图像的变换不变性。在对比学习中困难负样本是模型能够学习到更加鲁棒的视觉特征的关键因素。本文引入快速合成困难负样本的模块,将查询特征样本和已有困难负样本做线性凸组合合成更多的困难负样本加入到模型训练过程中。该方法通过增加自监督辅助任务的难度来促使模型学习到更具差异化的特征,让模型对包含不同语义信息的医学图像有更强的辨别能力,从而在新冠肺炎分类任务中达到更高的分类准确率。 2.本文提出基于Transformer的生成式自监督学习方法(MaskedAutoEncoder-Conv-Transformer,MAE-CvT)并应用于皮肤癌分类任务中。医学图像都来自相同的部位或组织,不同患者的图像有很高的相似性,而差异性往往体现在像素级的局部病灶部位。MAE-CvT遮挡图像部分像素块然后再恢复,这样的辅助任务设置方式使得模型更加关注医学图像的像素级信息,从而在相似的医学图像间提取到更具差异性的图像特征。MAE-CvT方法将图像均匀的分为多个图像块并以81.5%的比例随机遮挡图像块,将未遮挡的图像块送入Encoder提取图像编码,然后再用Decoder解码所有图像编码恢复图像。这个过程能让Encoder获取优秀的提取图像特征的能力。此外,本文还提出改进的Conv-Transformer模型,将卷积模块加入其中提升其局部建模能力,减小其Embedding长度有效降低模型参数量。Conv-Transformer作为MAE-CvT的Encoder,增强其对图像局部信息建模的能力,促使其更快、更好地提取图像特征。将MAE-CvT训练好的Encoder提取出做微调,其在皮肤癌分类任务中有不错的分类准确率。