无人车场景的语义分割及数据增广方法研究

李智勇¹

扫码查看

作者信息

1. 电子科技大学
折叠

摘要

图像语义分割技术是无人车自动驾驶领域使用的重要手段，但是目前无人车自动驾驶依然存在分割效果难以提升，数据集制作困难以及代价消耗过大的问题。针对上述问题，本文在语义分割结构设计上设计了一个多路卷积残差结构MCRB，两个语义分割网络MCRB-Net、AMCR-Net，并通过消融实验验证了它们在分割效果提升上的有效性。然后，本文设计了两种数据增广方法A-Pix2pix、M-GridMask来扩增Cityscapes数据集。最后结合语义分割网络进行实验，通过对比分析验证了本文设计的两种数据增广方法的有效性。具体研究内容如下：（1）针对常规卷积结构难以提取到足够特征信息的问题，从残差结构，多尺度特征融合以及多路卷积等方面综合考虑，设计了一个多路残差卷积结构MCRB，并且根据该结构设计了一个新的语义分割网络MCRB-Net。为了捕捉像素、通道之间依赖关系引入了一种双注意力机制模块。最后，利用该多路残差卷积结构MCRB，以及双注意力机制模块设计了一个新的语义分割网络模型AMCR-Net，并通过消融实验验证了本文设计的网络结构的有效性。（2）针对自动驾驶领域数据集采集制作困难的问题，设计了两种数据增广方法。第一种数据增广方法基于条件生成对抗网络Pix2pix，本文针对其生成器难以生成精细样本的问题，使用了AMCR-Net来取代生成器，重新设计了一种A-Pix2pix方法。针对现实场景中遮挡样本难以采集的问题，本文基于信息删除类数据增广方法GridMask，为了能够有效控制增广数据边缘区域的删除保留，对其Mask图像生成规则进行了改进,并设计了一种M-GridMask方法。（3）本文在提出的AMCR-Net以及U-Net基础上，基于两种数据增广方法进行实验，通过对语义分割效果的对比分析，评价了本文设计的两种数据增广方法，同时验证了本文A-Pix2pix和M-GridMask的有效性。

关键词

图像语义分割/数据增广/注意力机制/MCRB

引用本文复制引用

授予学位

硕士

学科专业

控制工程

导师

周小佳

学位年度

2022

学位授予单位

电子科技大学

语种

中文

中图分类号

段落导航