首页|基于深度学习的单目深度估计技术综述

基于深度学习的单目深度估计技术综述

扫码查看
场景的深度估计问题是计算机视觉领域中的经典问题之一,也是3维重建和图像合成等应用中的一个重要环节.基于深度学习的单目深度估计技术高速发展,各种网络结构相继提出.本文对基于深度学习的单目深度估计技术最新进展进行了综述,回顾了基于监督学习和基于无监督学习方法的发展历程.重点关注单目深度估计的优化思路及其在深度学习网络结构中的表现,将监督学习方法分为多尺度特征融合的方法、结合条件随机场(conditional random field,CRF)的方法、基于序数关系的方法、结合多元图像信息的方法和其他方法等5类;将无监督学习方法分为基于立体视觉的方法、基于运动恢复结构(structure from motion,SfM)的方法、结合对抗性网络的方法、基于序数关系的方法和结合不确定性的方法等5类.此外,还介绍了单目深度估计任务中常用的数据集和评价指标,并对目前基于深度学习的单目深度估计技术在精确度、泛化性、应用场景和无监督网络中不确定性研究等方面的现状和面临的挑战进行了讨论,为相关领域的研究人员提供一个比较全面的参考.
A review of monocular depth estimation techniques based on deep learning

宋巍、朱孟飞、张明华、赵丹枫、贺琪

展开 >

上海海洋大学信息学院,上海 201306

深度学习 单目深度估计 监督学习 无监督学习 多尺度特征融合 序数关系 立体视觉

国家自然科学基金上海市科委部分地方高校能力建设项目

6197224020050501900

2022

中国图象图形学报
中国科学院遥感应用研究所,中国图象图形学学会 ,北京应用物理与计算数学研究所

中国图象图形学报

CSTPCDCSCD北大核心
影响因子:1.111
ISSN:1006-8961
年,卷(期):2022.27(2)
  • 5
  • 4