计算机科学2021,Vol.48Issue(10) :212-219.DOI:10.11896/jsjkx.200900005

基于编码-解码器架构的光场深度估计方法

Light Field Depth Estimation Method Based on Encoder-decoder Architecture

晏旭 马帅 曾凤娇 郭正华 伍俊龙 杨平 许冰
计算机科学2021,Vol.48Issue(10) :212-219.DOI:10.11896/jsjkx.200900005

基于编码-解码器架构的光场深度估计方法

Light Field Depth Estimation Method Based on Encoder-decoder Architecture

晏旭 1马帅 1曾凤娇 1郭正华 1伍俊龙 1杨平 2许冰2
扫码查看

作者信息

  • 1. 中国科学院光电技术研究所自适应光学重点实验室 成都 610209;中国科学院光电技术研究所 成都 610209;中国科学院大学 北京 100049
  • 2. 中国科学院光电技术研究所自适应光学重点实验室 成都 610209;中国科学院光电技术研究所 成都 610209
  • 折叠

摘要

针对现有光场深度估计方法存在的计算时间长和精度低的问题,提出了一种融合光场结构特征的基于编码-解码器架构的光场深度估计方法.该方法基于卷积神经网络,采用端到端的方式进行计算,一次输入光场图像就可获得场景视差信息,计算量远低于传统方法,大大缩短了计算时间.为提高计算精确度,网络模型以光场图像的多方向极平面图堆叠体(Epipolar Plane Image Volume,EPI-volume)为输入,先利用多路编码模块对输入的光场图像进行特征提取,再使用带跳跃连接的编码-解码器架构进行特征聚合,使网络在逐像素视差估计时能够融合目标像素点邻域的上下文信息.此外,模型采取不同深度的卷积块从中心视角图中提取场景的结构特征,并将该结构特征引入对应的跳跃连接中,为视差图预测提供了额外的边缘特征参考,进一步提高了计算精确度.对HCI-4D光场基准测试集的实验结果表明,所提方法的坏像素率(BadPix)指标比对比方法降低了31.2%,均方误差(MSE)指标比对比方法降低了54.6%.对于基准测试集中的光场图像,深度估计的平均计算时间为1.2 s,计算速度远超对比方法.

关键词

光场/深度估计/极平面图/编码-解码器结构/上下文信息

引用本文复制引用

基金项目

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
参考文献量30
段落导航相关论文