计算机科学2021,Vol.48Issue(9) :216-222.DOI:10.11896/jsjkx.200800203

基于语义边缘驱动的实时双目深度估计算法

Real-time Binocular Depth Estimation Algorithm Based on Semantic Edge Drive

张鹏 王新晴 肖毅 段宝国 许鸿辉
计算机科学2021,Vol.48Issue(9) :216-222.DOI:10.11896/jsjkx.200800203

基于语义边缘驱动的实时双目深度估计算法

Real-time Binocular Depth Estimation Algorithm Based on Semantic Edge Drive

张鹏 1王新晴 1肖毅 1段宝国 1许鸿辉1
扫码查看

作者信息

  • 1. 陆军工程大学野战工程学院机械工程系 南京210007
  • 折叠

摘要

针对立体匹配中不适定区域视差边缘模糊、视差不平滑、单个物体视差不连续、存在空洞的问题,提出了一种轻量化的实时双目深度估计算法,将场景图、通过语义分割得到的语义标签图和通过边缘检测得到的边缘细节图作为辅助损失,以地面真值图为主要损失,构造了联合损失函数,以更好地监督视差图的生成.此外,构造了一个轻量化的特征提取模块,以降低特征提取模块的冗余性,从而更好地简化特征提取步骤,提高了网络的实时性和轻量性.最后利用由粗到精的思想实现视差图的渐进细化过程,利用低分辨率视差图变形与高分辨率特征图融合的方式,分阶段生成不同尺度的视差图,细节特征逐渐丰富,从而获得了最终的精准视差图.在KITTI 2012数据集上得到1.72%的3px错误率,在Middlebury 2014数据集中,Vintge错误率为1.23%,Playroom错误率为2.23%,Recycle错误率为1.65%,并且在Scene Flow数据集上计算时间低至0.76 s,内存占用量为2.4 G,显著提高了立体匹配算法在不适定区域的准确性和计算效率,能够满足工程实践中的实时性要求,对于实时三维重建任务有着很重要的指导意义.

关键词

立体匹配/语义理解/边缘提取/端到端网络/由粗到精

引用本文复制引用

基金项目

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
参考文献量26
段落导航相关论文