首页|基于改进ViT模型的水稻叶片病害识别方法

基于改进ViT模型的水稻叶片病害识别方法

扫码查看
针对真实环境下水稻叶片病害识别的背景复杂,且卷积神经网络(CNN)在水稻叶片病害图像识别中仅仅依赖于局部特征信息,识别效果并不理想等问题,提出一种基于改进的vision transformer(ViT)的水稻叶片病害识别方法.首先收集4类常见水稻叶片病害图像样本,每一类样本都包含简单和复杂的背景,为了增加样本多样性以及提高模型泛化能力,对图像进行镜像翻转、高斯模糊等图像增强操作.接着以ViT模型为主体,采用Inception v1与Inception v2组合而成的InceptionMLP模块代替原ViT模型中的原始线性卷积层MLP层,通过在不同大小的图像块上评估模型的性能,发现采用16×16图像块时,改进的ViT模型在水稻叶片白叶枯病、稻瘟病、褐斑病和东格鲁病的识别准确率上获得最佳结果,总体准确率达到了 99.24%,较原模型的准确率提高了 3.23百分点.改进的ViT模型通过增强特征表示能力,能够捕捉到不同感受野的特征,因此,在水稻叶片病害识别中,相比于基于CNN的ResNet和EfficientNet模型,分别提高了 2.30、20.11百分点的准确率.此外,与Transformer系列的BEiT、DaViT和Swin-Transformer模型相比,改进的ViT模型也显著提升了准确率,说明本研究得出的方法具有较高的准确率.

刘奕、崔艳荣

展开 >

长江大学计算机科学学院,湖北荆州 434000

水稻 叶片病害 图像识别 Transformer ViT Inception 准确率

国家自然科学基金面上项目

62077018

2024

江苏农业科学
江苏省农业科学院

江苏农业科学

CSTPCD北大核心
影响因子:0.732
ISSN:1002-1302
年,卷(期):2024.52(11)