基于工业场景的图像标注及目标检测研究

陈修¹

扫码查看

作者信息

1. 扬州大学
折叠

摘要

目标检测是计算机视觉领域的主要研究之一，其任务是检测图像中预定义类别的目标，并给出该目标在图像中的位置信息。随着人工智能视觉检测技术的快速发展，目标检测技术逐渐被应用到工业场景下。在实际工业应用中，生产线经常会遇到从加工一种产品转换为加工另一种产品的情况，训练一个检测新产品的模型需要大规模带有人工标注的数据集，这往往会耗费大量的人力和时间。同时，遇到工业场景下产品数量多且尺寸小的情况，检测模型的预测准确度不高，现有的算法很难取得较好的结果。为了提高工业场景下目标检测的精度并降低目标检测模型的训练成本，本文主要针对图像数据标注、多尺度特征融合以及基于小样本的迁移学习等问题展开研究。通过分析现有目标检测算法的优缺点，探索如何生成自动标注的合成数据集，提高目标检测模型的精度以及在少量数据样本的情况下使用迁移学习的算法完成工业场景下目标检测任务。本文的研究内容如下: (1)针对人工标注图像数据成本高的问题，提出了一种基于虚拟环境的合成数据集自动标注算法。该算法基于IsaacSim平台实现，整个动态生成阶段通过脚本实现,可以快速生成基于工业场景下大规模带有准确标注信息的合成数据集。避免了以往繁杂的人工标注工作，极大减少了数据采集的时间成本。同时该算法通过遮挡关系生成阶段和遮挡数据筛选阶段，能够筛选出场景中遮挡不严重的物体标注信息。使用筛选后的数据训练检测网络，可以提升整体系统的环境感知能力，确保工业机器人优先抓取那些不被遮挡的零件。该算法还能对虚拟合成数据和真实场景之间进行色彩迁移，减小合成数据集与真实数据集之间的差异。实验表明，使用该算法生成的合成数据集训练检测模型，模型在不做任何微调的情况下应用到真实世界中仍保持较好的精度。 (2)针对现有目标检测模型对尺度变化较大的目标检测效果不佳的问题，本文提出了一种基于多尺度特征融合的金字塔注意力目标检测算法。该算法使用多尺度金字塔注意力模块结合上游特征图中不同尺度的全局平均池化特征，获得更多的特征空间上下文信息，使用自适应的软权重构建下游特征，对每种池化尺度生成的特征计算权重，再对其进行组合。使用这种强化后的特征进行目标类别和位置的预测。实验表明，该算法能够对不同视角下尺度变化较大的物体有较好的鲁棒性，且相较于一些经典算法，在尺度较小的目标上检测精度提升较大。 (3)针对工业场景中较难获取产品模型数据的问题，本文提出了一种基于几何先验的注意力RPN(RegionProposalNetwork,区域提议网络)小样本目标检测算法。该算法先通过虚拟仿真软件制作与真实零件具有相似几何形状的零件合成数据集。接着在这些合成数据上训练带有注意力RPN模块的小样本目标检测网络，该注意力RPN模块能将特征金字塔结构中不同层的RoI特征进行融合，并使用全连接层自适应的赋予特征软权重，衡量不同层次RoI区域内特征的重要性，使目标检测网络在基类目标上能更好的获得提取几何特征的能力。最后，通过对比学习策略仅使用少量真实数据样本二次训练检测模型。实验结果表明，该算法仅使用少量真实样本数据在工业场景下比现有的小样本目标检测算法能检测出更多目标的同时保持较高的检测精度。

关键词

目标检测/图像标注/合成数据/特征融合/小样本学习

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

李玉洁

学位年度

2023

学位授予单位

扬州大学

语种

中文

中图分类号

段落导航