首页|无人车场景的语义分割及数据增广方法研究

无人车场景的语义分割及数据增广方法研究

李智勇

无人车场景的语义分割及数据增广方法研究

李智勇1
扫码查看

作者信息

  • 1. 电子科技大学
  • 折叠

摘要

图像语义分割技术是无人车自动驾驶领域使用的重要手段,但是目前无人车自动驾驶依然存在分割效果难以提升,数据集制作困难以及代价消耗过大的问题。 针对上述问题,本文在语义分割结构设计上设计了一个多路卷积残差结构MCRB,两个语义分割网络MCRB-Net、AMCR-Net,并通过消融实验验证了它们在分割效果提升上的有效性。然后,本文设计了两种数据增广方法A-Pix2pix、M-GridMask来扩增Cityscapes数据集。最后结合语义分割网络进行实验,通过对比分析验证了本文设计的两种数据增广方法的有效性。具体研究内容如下: (1)针对常规卷积结构难以提取到足够特征信息的问题,从残差结构,多尺度特征融合以及多路卷积等方面综合考虑,设计了一个多路残差卷积结构MCRB,并且根据该结构设计了一个新的语义分割网络MCRB-Net。为了捕捉像素、通道之间依赖关系引入了一种双注意力机制模块。最后,利用该多路残差卷积结构MCRB,以及双注意力机制模块设计了一个新的语义分割网络模型AMCR-Net,并通过消融实验验证了本文设计的网络结构的有效性。 (2)针对自动驾驶领域数据集采集制作困难的问题,设计了两种数据增广方法。第一种数据增广方法基于条件生成对抗网络Pix2pix,本文针对其生成器难以生成精细样本的问题,使用了AMCR-Net来取代生成器,重新设计了一种A-Pix2pix方法。针对现实场景中遮挡样本难以采集的问题,本文基于信息删除类数据增广方法GridMask,为了能够有效控制增广数据边缘区域的删除保留,对其Mask图像生成规则进行了改进,并设计了一种M-GridMask方法。 (3)本文在提出的AMCR-Net以及U-Net基础上,基于两种数据增广方法进行实验,通过对语义分割效果的对比分析,评价了本文设计的两种数据增广方法,同时验证了本文A-Pix2pix和M-GridMask的有效性。

关键词

图像语义分割/数据增广/注意力机制/MCRB

引用本文复制引用

授予学位

硕士

学科专业

控制工程

导师

周小佳

学位年度

2022

学位授予单位

电子科技大学

语种

中文

中图分类号

TP
段落导航相关论文