基于多尺度网络的双目视觉三维重建研究

胡军委¹

扫码查看

作者信息

1. 华南理工大学
折叠

摘要

双目视觉三维重建一直是计算机视觉领域的重要挑战，在卫星地图、自动驾驶、电影、游戏等场景有着重要的应用。传统的三维重建方法大多计算复杂，精度较低，随着深度学习的发展，越来越多的人们注意到深度学习在双目视觉三维重建领域的应用，尤其是近些年来许多深度学习网络模型的提出，更是极大地推进了双目视觉三维重建算法的发展。然而，目前的双目视觉三维重建技术在构建代价体时计算繁琐，训练成本较高，而且在物体无纹理或者低纹理时进行三维重建的精度也较低。因此，如何减少网络计算复杂度和训练成本，提高低纹理物体的重建精确度，是十分重要的问题。本文针对这类问题进行了深入的研究，主要的工作内容有：（1）针对目前三维重建过程中存在的精度较低、需要花费大量时间进行代价体构建的问题，提出了一种基于多尺度残差迭代细化的三维重建方法。基本思路是首先通过特征提取获得初始的深度图，然后使用多尺度特征融合金字塔网络得到多尺度的点特征，再利用多尺度残差MLP迭代网络来预测深度值，将深度预测与真实值之间的残差进行损失估计。实验表明，该方法能够获得更加精确的深度信息，提高物体的三维重建能力，并且简化了网络的模型，降低了计算量。（2）目前的三维重建方法在处理有遮挡、无纹理或者低纹理的局部背景时，限制了三维重建的鲁棒性和完整性，降低了三维重建模型的精度。本文针对这类问题，提出了一种基于多尺度自适应区域匹配网络的三维重建方法，利用自适应特征提取网络来提取物体不同丰富度的纹理信息，使用多层区域匹配权重对聚合后的代价体进行优化，强调其有用的信息，抑制不相关信息。实验表明，该方法能够获得更加精确、完整的深度图，生成更高质量的三维重建物体。本文分别研究了基于多尺度残差迭代细化网络和多尺度自适应区域匹配网络的三维重建方法，所提出的方法在公开数据集上有较好的表现结果，证明了所提方法的有效性。

关键词

双目视觉/三维重建/迭代细化/多尺度网络/深度学习

引用本文复制引用

授予学位

硕士

学科专业

信息与通信工程

导师

孙季丰

学位年度

2022

学位授予单位

华南理工大学

语种

中文

中图分类号

段落导航