基于Transformer网络的医学图像分割方法研究

叶晋豫¹

扫码查看

作者信息

1. 太原理工大学
折叠

摘要

医学图像分割已经成为医学图像处理的重要组成部分，它在医学研究、计算机辅助手术、临床诊断、手术规划、病理分析、信息处理等方面都有很大的研究意义与应用价值。但是，医学影像的解读受限于医生的主观性，巨大的差异性认知，以及疲倦影响等因素。此时，运用计算机影像处理技术，对切片影像进行分析和处理，可以对人体器官、病变体等进行分割提取，并进行三维重建和展示。通过这种方法，可以对病灶和其它重要的部位做出定性甚至定量的分析，从而大大提高医疗诊断的准确性和可靠性。所以，医学影像进行自动分割以达到对疾病进行自动化诊断与及时诊治的目的，是非常有实际意义的。近年来，Transformer在自然语言处理领域的成功应用，使得相关学者开始探讨和尝试其在计算机视觉领域的应用。传统卷积网络存在的归纳偏置的问题，且更关注局部信息而忽略全局。视觉Transformer更加关注全局特征的提取。因此本文基于Transformer网络的方法来对医学图像分割进行研究，主要研究内容有以下两点：第一个研究内容是提出融合上下文金字塔机制和Transformer的方法来对医学图像进行分割。使用SwinTransformer网络构建了一个医学图像分割网络，最大限度地发挥Transformer关注全局信息的优势，并构建了一种对称的编解码器型结构。在编码器中，实现了从局部到全局的自我关注；在解码器中，全局特征被上采样到与输入分辨率相同后用于相应的像素级分割预测。为了提取边缘和角落点等局部特征，设计了基于上下文金字塔结构的边缘感知模块，利用具有不同尺度的卷积核来抽取不同尺度的特征，高层特征表示更多的语义信息，而浅层特征表示更多详细信息。通过融合不同粒度的空间信息，从多个尺度捕获更多的空间语义特征，使网络能够学习更丰富的上下文信息。提取尽可能多的边缘和角落点等局部特征，以提高分割效果。实验数据集来自在腹部多器官CT图像分割任务和ACDC心脏MRI图像分割任务，其中的实验表明基于SwinTransformer的边缘感知上下文金字塔网络可以更精确完成分割任务。第二个研究内容是在第一个研究内容的基础上提出了改进自注意力模块，融合高斯加权自注意力和外部注意力的方法。可以降低Transformer模块中自注意力具有的二次计算能力复杂性，提出了局部全局高斯自注意力，它依次在细粒度局部和粗粒度的全局上下文上执行自注意力上下文，还引入了一个可学习的高斯矩阵，用来强调每个查询附近的区域以便于更低的计算成本获得更好的局部感知。在全局注意力的计算中，本文利用了轴向注意力来降低运算的复杂度，并利用高斯矩阵来提高邻近的标志块的权重。在此基础上，将其与外部关注力整合，实现对内管理的统一，并实现帧内的同步关联。该模块旨在取代原有的Transformer编码器，以获得更好的视觉性能任务和较低的时间复杂性。实验结果证明，使用该方法有效的利用降低计算量与参数量且保证了分割的准确性。最后，为了进一步优化本文的模型，引入了一种基于轮廓和形状的空间距离测度的边界损失，解决了高分辨率图像分割中的区域丢失难题，并为图像分割中的区域丢失提供了辅助信息，对图像进行了更好的边界分割。总的来说本论文针对医学图像的分割问题提出融合上下文金字塔机制和Transformer的方法来对医学图像进行分割，为了降低Transformer模块中自注意力具有的二次计算能力复杂性，在上一个研究内容的基础上重新设计了自注意力模块，融合高斯加权自注意力和外部注意力。

关键词

医学图像分割/Transformer网络/上下文金字塔/自注意力机制/多尺度特征

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

邓红霞/祁永平

学位年度

2023

学位授予单位

太原理工大学

语种

中文

中图分类号

段落导航