摘要
针对DeepLabv3+网络在进行城市街景图像分割任务时,没有充分利用到网络中多层级特征信息,导致分割结果存在大目标有孔洞、边缘目标分割不够精细等不足;并且考虑到城市街景数据具有天然的空间位置特殊性,本文提出在DeepLabv3+网络的基础上引入高度有效驱动注意力机制(height-driven efficient attention model,HEAM)与多层级特征融合模块(multi-stage feature fusion model,MFFM),将HEAM嵌入特征提取网络与空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)结构中,使其对目标关注更多垂直方向上的空间位置信息;MFFM通过融合多层特征图,在网络中形成多条融合支路依次连接到网络解码端,采用逐次上采样提高解码时像素上的连续性.将改进的网络通过Cam Vid城市街景数据集验证测试,实验结果表明,该网络能有效改善DeepLabv3+的不足,并且合理运用了数据集的位置先验性,增强了分割效果,在Cam Vid测试集上平均交并比(mean intersection over union,MIoU)达到了 68.2%.
基金项目
国家自然科学基金(61571182)
国家自然科学基金(61601177)
国家留学基金(201808420418)
湖北省自然科学基金(2019CFB530)
湖北省科技厅重大专项(2019ZYYD020)
襄阳湖北工业大学产业研究院科研项目(XYYJ2022C05)
资助项目()