一种有效融合多尺度特征的图像语义分割方法

An image semantic segmentation method effectively fusing multi-scale features

许光宇 ¹汤伟建¹

扫码查看

作者信息

1. 安徽理工大学计算机科学与工程学院,安徽淮南232001
折叠

摘要

卷积神经网络在高级计算机视觉任务中展现出强大的特征学习能力,已经在图像语义分割任务中取得了显著的效果.然而,如何有效地利用多尺度的特征信息一直是个难点.本文提出一种有效融合多尺度特征的图像语义分割方法.该方法包含4个基础模块,分别为特征融合模块(feature fusion module,FFM)、空间信息模块(spatial information module,SIM)、全局池化模块(global pooling module,GPM)和边界细化模块(boundary refinement module,BRM).FFM 采用了注意力机制和残差结构,以提高融合多尺度特征的效率,SIM由卷积和平均池化组成,为模型提供额外的空间细节信息以辅助定位对象的边缘信息,GPM提取图像的全局信息,能够显著提高模型的性能,BRM以残差结构为核心,对特征图进行边界细化.本文在全卷积神经网络中添加4个基础模块,从而有效地利用多尺度的特征信息.在PASCAL VOC 2012数据集上的实验结果表明该方法相比全卷积神经网络的平均交并比提高了 8.7％,在同一框架下与其他方法的对比结果也验证了其性能的有效性.

关键词

卷积神经网络/图像语义分割/多尺度特征/特征融合/注意力机制

引用本文复制引用

基金项目

国家自然科学基金(61471004)

安徽理工大学博士专项(ZX942)

出版年

2022

光电子·激光

天津理工大学中国光学学会

光电子·激光

CSCD北大核心

影响因子：1.437

ISSN：1005-0086

被引量1

参考文献量4

段落导航