基于双通道注意力机制的ResNet果实外观品质分类

ResNet fruit appearance quality classification based on dual chan-nel attention mechanism

赵辉 ¹乔艳军 ²王红君 ²岳有军²

扫码查看

作者信息

1. 天津理工大学电气电子工程学院天津市复杂系统控制理论与应用重点实验室,天津300384;天津农学院工程技术学院,天津300392
2. 天津理工大学电气电子工程学院天津市复杂系统控制理论与应用重点实验室,天津300384
折叠

摘要

为了实现对采摘后的果实进行快速、精确的外观品质分类,并配合分拣生产线完成果实大规模集中分拣,该研究提出了一种基于改进ResNet的果实分类方法.首先,将深度残差神经网络(deep residual neural network,ResNet)网络中的残差模块与双通道 SE 模块(dual channel squeeze-and-excitation block,DC-SE Block)结合,增强有效的通道特征并抑制低效或无效的通道特征,提高特征图的表达能力,从而提升识别精度;其次,在原始ResNet模型中加入Inception模块,将果实不同尺度的特征进行融合,增强对较小缺陷的识别能力;最后,对收集到的4类不同外观品质的果实图像进行数据增强并利用迁移学习的方法对模型进行初始化.以苹果为例进行的试验结果表明:经过数据集训练之后的改进模型,在测试集下的准确率达到99.7％,高于原模型的98.5％;精确率达到99.7％,高于原模型的98.3％;召回率达到99.7％,高于原模型的98.7％;在图形处理器(graphic processing unit,GPU)下的平均检测速度达到32.3帧/s,略低于原模型的35.7帧/s.与GoogleNet、MobileNet等几种目前先进的分类方法进行比较并对不同改进模型进行对比试验的结果表明,该方法具有良好的分类性能,对解决果实外观品质的精准分级问题具有重要参考价值.

关键词

图像增强/外观品质分类/深度残差神经网络/双通道SE模块/Inception模块/迁移学习

引用本文复制引用

基金项目

天津市科技支撑计划(18YFZCNC01120)

天津市科技支撑计划(19YFZCSN00360)

出版年

2022

光电子·激光

天津理工大学中国光学学会

光电子·激光

CSCD北大核心

影响因子：1.437

ISSN：1005-0086

参考文献量5

段落导航