基于改进HRNet架构的图像语义分割算法应用研究

扫码查看

原文链接

万方数据
维普

中文摘要：针对当前主流图像语义分割算法提取的特征图分辨率过低,上采样过程中有效语义信息损失过大,易丢失像素点和目标物体区域相关性的问题,提出了一种基于HRNet-OCR联合交叉注意力机制的图像语义分割算法.该法先采用HRNet替代ResNet作为特征提取骨干网络,保留特征提取过程中的高分辨率信息;然后融合OCR算法对图像进行初步的粗略分割,确定目标对象的大致区域;最后,引入交叉注意力机制模块对像素和对象区域的关联程度加权计算,实现像素的精准分类,保留分割区域的边缘细节.实验结果表明,与常见的分割算法FCN、PSPNet、DeepLabv3+等相比,所提算法在ADE20K、Cityscapes、PASCAL VOC 2012数据集上的mIoU分别提升5.37％、3.09％和2.71％,且可以有效保留细节信息,大幅度改善分割精度.

外文标题：Application Study of Image Semantic Segmentation Algorithm Based on Improved HRNet Architecture

作者：

胡航、牛晓伟、左昊、金重阳

展开 >

作者单位：

重庆三峡学院电子与信息工程学院,重庆 404100

关键词：

语义分割 HRNet OCR 交叉注意力机制

基金：

国家重点研发计划科技部专项重庆市科技局面上项目重庆市教委科技项目重庆市教委科技项目三峡库区地质环境监测与灾害预警—重庆市重点实验室开放基金

项目编号：

2021YFB39014052021YFB3901400cstc2019jcyj-msxm1328KJQN202101215KJQN202101226ZD2020A0301

出版年：

2022

DOI：

10.3969/j.issn.1007-1423.2022.18.004

现代计算机

中大控股

现代计算机

影响因子：0.292

ISSN：1007-1423

年,卷(期)：2022.28(18)

被引量1
参考文献量16