医学影像的深度对比自监督分类算法研究与应用

王国超¹

扫码查看

作者信息

1. 太原科技大学
折叠

摘要

自监督方法，特别是对比自监督方法，因其可训练无标签图像的特点引起了医学领域的广泛关注。医学影像，由于标签获取困难，将其与自监督相结合具有重要的现实意义。然而，对比方法直接用于医学影像分类可能存在模型学习能力不足的问题，这会导致精度不高以及模型针对下游数据集缺乏泛化性。因此，本文从两个方面来解决这些缺点。第一，提出了多方位随机擦除数据增强和对比重构自监督模型。第二，提出了多步自监督预训练策略。本文的主要研究内容如下： (1)针对对比自监督方法在直接应用于医学影像分类时，由于模型学习图像特征的能力不足导致精度不高的问题，本文提出两个方案。首先，本文引入了多方位随机擦除数据增强方法来优化SimCLR对比模型，在原始随机擦除方法的基础上，缩小了擦除区域面积的同时增加了区域数量，使擦除区域遍布各个方位，避免由于擦除区域过大而遮挡医学影像中的病理。之后，本文又提出了融合编码器解码器的对比重构自监督模型(contrastandrecontructionself-supervisedmodel，CRSM)，该模型在SimCLR中引入了另一种自监督代理任务，即图像重构。根据对比模型的编码器构建了相对应的解码器网络，使得在图像进行对比学习的同时对图像进行重构操作，从而提高模型的分类精度。实验结果表明本文的模型有良好的性能，相较于基线网络，在几个目标数据集上的精度提升都超过3%。 (2)为进一步提升CRSM在肺部疾病数据集上的分类准确性和泛化能力，本文提出了一种多步自监督预训练策略。首先，使用CheXpert胸部疾病数据集(包含肺部疾病)对CRSM进行第一步预训练；然后，使用第一步预训练的模型参数初始化CRSM，并将其用于目标数据集(如Covid-19)的第二步预训练；最后将所得参数迁移到下游任务的线性分类器，对目标数据集进行分类。为了验证模型泛化性，本研究在实验中使用CheXpert对模型进行预训练后，直接将其参数用于下游目标数据集分类任务，而不再对目标数据集进行预训练。实验证明经过CheXpert数据集预训练后，模型可以用于其它肺部疾病数据集分类并有较高的精度，该策略也可以进一步提升CRSM在目标数据集上的分类精度，精度提升在1%以上。 (3)本文利用上述构建的对比重构自监督模型作为后端技术支撑，设计了自监督医学影像智能分类系统。首先讨论分析了用户需求，构建了包括打开图像文件、图像展示和结果展示等前端功能，还有使用训练好的模型进行图像分类的后端功能。通过网络传输将前端展示界面和后端模型进行连接，从而实现了后端模型分类结果在前端行展示。

关键词

自监督学习/数据增强/图像重构/医学影像

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

李建伟

学位年度

2023

学位授予单位

太原科技大学

语种

中文

中图分类号

段落导航