基于编码-解码器架构的光场深度估计方法

Light Field Depth Estimation Method Based on Encoder-decoder Architecture

晏旭 ¹马帅 ¹曾凤娇 ¹郭正华 ¹伍俊龙 ¹杨平 ²许冰²

扫码查看

作者信息

1. 中国科学院光电技术研究所自适应光学重点实验室成都 610209;中国科学院光电技术研究所成都 610209;中国科学院大学北京 100049
2. 中国科学院光电技术研究所自适应光学重点实验室成都 610209;中国科学院光电技术研究所成都 610209
折叠

摘要

针对现有光场深度估计方法存在的计算时间长和精度低的问题,提出了一种融合光场结构特征的基于编码-解码器架构的光场深度估计方法.该方法基于卷积神经网络,采用端到端的方式进行计算,一次输入光场图像就可获得场景视差信息,计算量远低于传统方法,大大缩短了计算时间.为提高计算精确度,网络模型以光场图像的多方向极平面图堆叠体(Epipolar Plane Image Volume,EPI-volume)为输入,先利用多路编码模块对输入的光场图像进行特征提取,再使用带跳跃连接的编码-解码器架构进行特征聚合,使网络在逐像素视差估计时能够融合目标像素点邻域的上下文信息.此外,模型采取不同深度的卷积块从中心视角图中提取场景的结构特征,并将该结构特征引入对应的跳跃连接中,为视差图预测提供了额外的边缘特征参考,进一步提高了计算精确度.对HCI-4D光场基准测试集的实验结果表明,所提方法的坏像素率(BadPix)指标比对比方法降低了31.2％,均方误差(MSE)指标比对比方法降低了54.6％.对于基准测试集中的光场图像,深度估计的平均计算时间为1.2 s,计算速度远超对比方法.

关键词

光场/深度估计/极平面图/编码-解码器结构/上下文信息

引用本文复制引用

基金项目

出版年

2021

计算机科学

重庆西南信息有限公司（原科技部西南信息中心）

计算机科学

CSTPCDCSCD北大核心

影响因子：0.944

ISSN：1002-137X

参考文献量30

段落导航