摘要
随着计算机技术的进步,现有的Transformer被扩展成处理计算机视觉任务的网络结构.为提高黑色素瘤的早期确诊率以提高皮肤病患者的治愈率,本文提出一种改进的基于PiT(pyra-mid pooling transformer)的网络模型来实现对7种皮肤病变的皮肤镜图像进行自动分类.本文模型主要由PiT模块和抗干扰模块等2个部分组成,Pit继承了 ViT的优点,并通过池化进行空间尺寸转换来提高模型的鲁棒性,经过预训练的PiT网络拥有大量的自然图像特征,且PiT部分网络可为下游的分类任务提供所需的图像特征,本文设计出抗干扰模块,用来抵抗皮肤镜图像中的干扰因素(如毛发、异物遮挡)的影响,从而提高模型性能、提高分类精度.实验结果表明,本文模型在ISIC2018验证集上的分类准确率、精确率、召回率、F1-score值分别高达91.58%、83.59%、89.92%、86.34%,每秒传输帧数(frames per second,FPS)达到85 Hz与现有的几种先进的分类网络相比,分类性能和模型效率都有所提高,具有相对优势,证明本文模型具有一定的实用价值.