基于深度学习的混料识别方法的研究与应用

蒋昊宸¹

扫码查看

作者信息

1. 武汉工程大学
折叠

摘要

目标检测技术是基于视觉系统的工业分拣任务的核心。得益于深度学习技术的火热发展，基于深度神经网路的目标检测技术也逐渐被应用于工业分拣领域。然而这类目标检测技术受限于较深层次的网络结构所产生的大量权重参数和计算量，以及硬件设备的局限性，使其在面对实效性要求较高的工业分拣任务时，存在推理速度不足的问题。同时，在实际的工业分拣任务中待分拣的物体往往是混杂着多种类别不同尺寸的物料，即混料。目标检测技术能很好区分不同类别物体之间的特征差异，但对于同类物体的不同尺寸差异却很难区分出来。因此目前基于深度学习的目标检测技术在面对工业场景下的混料实时检测任务时仍然具有较大的挑战。针对这些问题，本文以工业场景下的混料识别作为研究对象，提出了一种基于改进的轻量级混料检测方法以及一种基于图像语义分割的混料多尺度分类方法。分别制作了混料识别数据集和混料分割数据集以用于验证两种方法的检测效果。具体研究工作如下：（1）针对目前基于深度学习的目标检测模型在检测速度上无法很好的满足工业场景下的实时检测需求，本文提出了一种基于轻量级神经网络的混料检测方法G-YOLO。本文选择了目前在检测精度和实时性上都有不错表现的单阶段目标检测模型YOLOV4作为基础网络，使用轻量级的GhostNet来取代其原始的主干特征提取网络，在保证检测精度的同时，减少网络的参数量。此外本文针对YOLOV4的特征融合网络进行剪枝优化，以加快特征融合的过程从而提升网络的检测速度。同时，为了进一步提高网络的检测性能，本文使用K-Means算法重新设计了网络的anchor尺寸大小。基于自建的混料识别数据集的实验结果表明，改进后的G-YOLO目标检测模型在精度上于原始的YOLOV4几乎持平，在检测速度上远远高于YOLOV4。（2）由于目标检测属于目标级别的任务，这类视觉技术只针对物体本身的特征进行分类识别，而对物体的大小差异并不敏感。然而在实际的工业生产环境中，所面对的分拣对象往往是包含多种类别且尺寸大小不同的混料。基于深度学习的目标检测技术对于同类型物体的不同尺寸差异并不敏感，无法很好对尺度进行区分。针对上诉问题，本文提出了一种基于图像语义分割的混料多尺度分类方法。本文首先对整个混料识别分拣平台和整体的操作流程进行设计，并以基于深度学习的语义分割模型DeepLabV3+为基础，使用轻量级的MobilenetV2替换DeepLabV3+原始的特征提取网络，得到改进的DeepLabV3+网络，并使用该网络对采集到的混料图像进行语义分割。最终对分割后的图像进行轮廓提取并计算每个物料的面积，通过与设定的参考阈值进行对比，对物料的尺度进行判断，从而实现物料的多尺度分类。（3）由于目标检测领域没有开源的用于工业分拣的混料识别数据集，因此本文收集了目前工业场景中常用于分拣任务的三种物料：螺母、齿轮、轴承，共1000张作为混料识别数据集的原始样本。为了提高模型的泛化能力，减少因数据集样本不足而出现过拟合的现象。本文使用旋转、镜像翻转等多种数据增强技术来扩充混料识别数据集中的样本数量。最终将样本数量扩增到4000张。此外本文在混料识别数据集的基础上，进行进一步的类别细分和样本扩充，将每种类别物料根据其不同的摆放姿态进行类别细分，从而获得用于混料多尺度分类的混料分割数据集。该数据集包含6个类：轴承0、轴承1、齿轮0、齿轮1、螺母0和螺母1，其中0代表平放姿态，1代表立直姿态。数据集的原始样本数量共2000张，并使用数据增强算法将样本数量扩充至8000张，由于后续的模型训练与预测。

关键词

目标检测/混料识别方法/机器视觉/深度学习/语义分割

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

魏巍

学位年度

2022

学位授予单位

武汉工程大学

语种

中文

中图分类号

段落导航