摘要
医学影像分割旨在划分出医学影像中的器官、病灶等感兴趣区域,在临床医学中发挥着重要作用,可以帮助医生诊断疾病、制定治疗方案。长期以来,卷积神经网络占据着医学影像分割任务的主导地位,使得医学影像分割具有更高的准确度和更快的速度,但卷积神经网络不能建立远距离依赖关系的局部特性也限制了医学影像分割的发展。近年来,由于Transformer模型在自然语言处理任务上的出色表现,研究者开始尝试将其引入计算机视觉领域。与卷积神经网络不同,Transformer模型通过自注意力机制实现了对输入序列的全局感知,使得模型能够更好地捕捉图像中的远距离依赖关系和全局信息,在图像分类、目标检测等计算机视觉任务中得到了广泛的应用,在医学影像分割领域同样有着重要的研究价值。本文针对卷积神经网络缺乏全局依赖的缺陷,研究Transformer模型的特性,对医学影像分割方法进行探索和改进,提出新型医学影像分割方法并通过对病灶和器官的分割进行实验验证。主要研究内容如下: (1)针对卷积神经网络缺乏全局依赖的问题,提出基于卷积和可变形注意力的脑胶质瘤图像分割方法Med-CaDA。首先,引入三维瓶颈残差模块用于局部特征提取,引入Transformer用于全局信息建模,二者串行组合以最大程度建立不同分辨率下的局部和全局依赖关系。另外,针对三维医学影像数据参数量和计算量过大的问题,对三维瓶颈残差模块进行改进并引入具有稀疏性的可变形注意力。实验结果表明,Med-CaDA具有精准高效的脑胶质瘤图像分割性能。 (2)传统自注意力机制参数量和计算量过大,基于局部窗口的注意力机制虽然降低了参数量和计算量,但会限制远距离像素间的交互。针对以上问题,提出基于多局部感知模块和上下文交叉注意力的医学影像分割方法MLPFormer。首先,提出包含局部窗口注意力、深度可分离卷积、局部水平注意力和局部垂直注意力的多局部感知模块,用于局部和全局特征提取。另外,设计上下文交叉注意力以丰富跳跃连接,减少低级和高级特征之间的语义差距。实验结果表明,MLPFormer在腹部器官分割上有较好的分割效果,且多局部感知模块和上下文交叉注意力能有效提高模型腹部器官分割准确率。