摘要
视觉感知是无人驾驶技术中的重要一环,而语义分割技术又是实现视觉感知的主要技术手段之一.现在的语义分割技术多采用计算量大、内存占用高的空洞卷积来提取高分辨率特征图,从而导致现在主流的语义分割网络分割速度不足,无法有效应用于无人驾驶的场景中.针对这一问题,提出了一种实时性更好的语义分割网络.首先,采用了一种轻量级的卷积神经网络作为编码器,并且使用跨步卷积和常规卷积替换了耗时、耗内存的空洞卷积.然后,为了得到与DeepLabv v3+相似的特征图,提出了一种新的联合上采样模块:多级特征图联合上采样模块(multi-scale feature map joint pyramid upsamping,MJPU),通过融合编码器的多个特征图,生成了语义信息更加丰富的高分辨率特征图.通过Cityscapes数据集上的实验表明,相比于主流语义分割网络Deeplabv3+,该网络在不损失大量性能的前提下,可以将分割速度提高2.25倍,达到32.3 FPS/s.从而使网络具有更好的实时性,更加适合应用于无人驾驶场景.
基金项目
吉林省科技发展计划技术攻关项目(20200401127GX)
吉林省科技发展计划重点研发项目(20200403037SF)
吉林省发改委项目(2019C040-3)