摘要
针对当前主流图像语义分割算法提取的特征图分辨率过低,上采样过程中有效语义信息损失过大,易丢失像素点和目标物体区域相关性的问题,提出了一种基于HRNet-OCR联合交叉注意力机制的图像语义分割算法.该法先采用HRNet替代ResNet作为特征提取骨干网络,保留特征提取过程中的高分辨率信息;然后融合OCR算法对图像进行初步的粗略分割,确定目标对象的大致区域;最后,引入交叉注意力机制模块对像素和对象区域的关联程度加权计算,实现像素的精准分类,保留分割区域的边缘细节.实验结果表明,与常见的分割算法FCN、PSPNet、DeepLabv3+等相比,所提算法在ADE20K、Cityscapes、PASCAL VOC 2012数据集上的mIoU分别提升5.37%、3.09%和2.71%,且可以有效保留细节信息,大幅度改善分割精度.
基金项目
国家重点研发计划(2021YFB3901405)
科技部专项(2021YFB3901400)
重庆市科技局面上项目(cstc2019jcyj-msxm1328)
重庆市教委科技项目(KJQN202101215)
重庆市教委科技项目(KJQN202101226)
三峡库区地质环境监测与灾害预警—重庆市重点实验室开放基金(ZD2020A0301)