摘要
自监督方法,特别是对比自监督方法,因其可训练无标签图像的特点引起了医学领域的广泛关注。医学影像,由于标签获取困难,将其与自监督相结合具有重要的现实意义。然而,对比方法直接用于医学影像分类可能存在模型学习能力不足的问题,这会导致精度不高以及模型针对下游数据集缺乏泛化性。因此,本文从两个方面来解决这些缺点。第一,提出了多方位随机擦除数据增强和对比重构自监督模型。第二,提出了多步自监督预训练策略。本文的主要研究内容如下: (1)针对对比自监督方法在直接应用于医学影像分类时,由于模型学习图像特征的能力不足导致精度不高的问题,本文提出两个方案。首先,本文引入了多方位随机擦除数据增强方法来优化SimCLR对比模型,在原始随机擦除方法的基础上,缩小了擦除区域面积的同时增加了区域数量,使擦除区域遍布各个方位,避免由于擦除区域过大而遮挡医学影像中的病理。之后,本文又提出了融合编码器解码器的对比重构自监督模型(contrastandrecontructionself-supervisedmodel,CRSM),该模型在SimCLR中引入了另一种自监督代理任务,即图像重构。根据对比模型的编码器构建了相对应的解码器网络,使得在图像进行对比学习的同时对图像进行重构操作,从而提高模型的分类精度。实验结果表明本文的模型有良好的性能,相较于基线网络,在几个目标数据集上的精度提升都超过3%。 (2)为进一步提升CRSM在肺部疾病数据集上的分类准确性和泛化能力,本文提出了一种多步自监督预训练策略。首先,使用CheXpert胸部疾病数据集(包含肺部疾病)对CRSM进行第一步预训练;然后,使用第一步预训练的模型参数初始化CRSM,并将其用于目标数据集(如Covid-19)的第二步预训练;最后将所得参数迁移到下游任务的线性分类器,对目标数据集进行分类。为了验证模型泛化性,本研究在实验中使用CheXpert对模型进行预训练后,直接将其参数用于下游目标数据集分类任务,而不再对目标数据集进行预训练。实验证明经过CheXpert数据集预训练后,模型可以用于其它肺部疾病数据集分类并有较高的精度,该策略也可以进一步提升CRSM在目标数据集上的分类精度,精度提升在1%以上。 (3)本文利用上述构建的对比重构自监督模型作为后端技术支撑,设计了自监督医学影像智能分类系统。首先讨论分析了用户需求,构建了包括打开图像文件、图像展示和结果展示等前端功能,还有使用训练好的模型进行图像分类的后端功能。通过网络传输将前端展示界面和后端模型进行连接,从而实现了后端模型分类结果在前端行展示。