基于深度学习的单目深度估计技术综述

扫码查看

原文链接

NETL
NSTL
万方数据
维普

中文摘要：场景的深度估计问题是计算机视觉领域中的经典问题之一,也是3维重建和图像合成等应用中的一个重要环节.基于深度学习的单目深度估计技术高速发展,各种网络结构相继提出.本文对基于深度学习的单目深度估计技术最新进展进行了综述,回顾了基于监督学习和基于无监督学习方法的发展历程.重点关注单目深度估计的优化思路及其在深度学习网络结构中的表现,将监督学习方法分为多尺度特征融合的方法、结合条件随机场(conditional random field,CRF)的方法、基于序数关系的方法、结合多元图像信息的方法和其他方法等5类;将无监督学习方法分为基于立体视觉的方法、基于运动恢复结构(structure from motion,SfM)的方法、结合对抗性网络的方法、基于序数关系的方法和结合不确定性的方法等5类.此外,还介绍了单目深度估计任务中常用的数据集和评价指标,并对目前基于深度学习的单目深度估计技术在精确度、泛化性、应用场景和无监督网络中不确定性研究等方面的现状和面临的挑战进行了讨论,为相关领域的研究人员提供一个比较全面的参考.

外文标题：A review of monocular depth estimation techniques based on deep learning

作者：

宋巍、朱孟飞、张明华、赵丹枫、贺琪

展开 >

作者单位：

上海海洋大学信息学院,上海 201306

关键词：

深度学习单目深度估计监督学习无监督学习多尺度特征融合序数关系立体视觉

基金：

国家自然科学基金上海市科委部分地方高校能力建设项目

项目编号：

6197224020050501900

出版年：

2022

中国图象图形学报

中国科学院遥感应用研究所,中国图象图形学学会 ,北京应用物理与计算数学研究所

中国图象图形学报

CSTPCDCSCD北大核心

影响因子：1.111

ISSN：1006-8961

年,卷(期)：2022.27(2)

被引量5
参考文献量4