江苏农业科学2024,Vol.52Issue(11) :197-204.DOI:10.15889/j.issn.1002-1302.2024.11.026

基于改进ViT模型的水稻叶片病害识别方法

刘奕 崔艳荣
江苏农业科学2024,Vol.52Issue(11) :197-204.DOI:10.15889/j.issn.1002-1302.2024.11.026

基于改进ViT模型的水稻叶片病害识别方法

刘奕 1崔艳荣1
扫码查看

作者信息

  • 1. 长江大学计算机科学学院,湖北荆州 434000
  • 折叠

摘要

针对真实环境下水稻叶片病害识别的背景复杂,且卷积神经网络(CNN)在水稻叶片病害图像识别中仅仅依赖于局部特征信息,识别效果并不理想等问题,提出一种基于改进的vision transformer(ViT)的水稻叶片病害识别方法.首先收集4类常见水稻叶片病害图像样本,每一类样本都包含简单和复杂的背景,为了增加样本多样性以及提高模型泛化能力,对图像进行镜像翻转、高斯模糊等图像增强操作.接着以ViT模型为主体,采用Inception v1与Inception v2组合而成的InceptionMLP模块代替原ViT模型中的原始线性卷积层MLP层,通过在不同大小的图像块上评估模型的性能,发现采用16×16图像块时,改进的ViT模型在水稻叶片白叶枯病、稻瘟病、褐斑病和东格鲁病的识别准确率上获得最佳结果,总体准确率达到了 99.24%,较原模型的准确率提高了 3.23百分点.改进的ViT模型通过增强特征表示能力,能够捕捉到不同感受野的特征,因此,在水稻叶片病害识别中,相比于基于CNN的ResNet和EfficientNet模型,分别提高了 2.30、20.11百分点的准确率.此外,与Transformer系列的BEiT、DaViT和Swin-Transformer模型相比,改进的ViT模型也显著提升了准确率,说明本研究得出的方法具有较高的准确率.

关键词

水稻/叶片病害/图像识别/Transformer/ViT/Inception/准确率

引用本文复制引用

基金项目

国家自然科学基金面上项目(62077018)

出版年

2024
江苏农业科学
江苏省农业科学院

江苏农业科学

CSTPCD北大核心
影响因子:0.732
ISSN:1002-1302
参考文献量25
段落导航相关论文