摘要
卷积神经网络在高级计算机视觉任务中展现出强大的特征学习能力,已经在图像语义分割任务中取得了显著的效果.然而,如何有效地利用多尺度的特征信息一直是个难点.本文提出一种有效融合多尺度特征的图像语义分割方法.该方法包含4个基础模块,分别为特征融合模块(feature fusion module,FFM)、空间信息模块(spatial information module,SIM)、全局池化模块(global pooling module,GPM)和边界细化模块(boundary refinement module,BRM).FFM 采用了注意力机制和残差结构,以提高融合多尺度特征的效率,SIM由卷积和平均池化组成,为模型提供额外的空间细节信息以辅助定位对象的边缘信息,GPM提取图像的全局信息,能够显著提高模型的性能,BRM以残差结构为核心,对特征图进行边界细化.本文在全卷积神经网络中添加4个基础模块,从而有效地利用多尺度的特征信息.在PASCAL VOC 2012数据集上的实验结果表明该方法相比全卷积神经网络的平均交并比提高了 8.7%,在同一框架下与其他方法的对比结果也验证了其性能的有效性.