融合深度神经网络的视觉SLAM系统研究

朱必宏¹

扫码查看

作者信息

1. 浙江科技学院
折叠

摘要

同时定位与地图构建技术（Simultaneous Localization and Mapping，即SLAM）是移动机器人、无人机、自动驾驶、增强现实等领域的关键基础技术之一。当使用相机来采集原始数据时，其又可以称为视觉SLAM（或VSLAM）。目前的大多数视觉SLAM系统都是通过匹配图像间的特征形成特征点对，然后使用得到特征点对来估计相机的位姿，并同时构建未知环境的地图。因此，特征点匹配的准确性直接影响了视觉SLAM系统的定位精度和生成的地图的质量。由于视觉SLAM通过估计图像帧之间的相对运动，然后逐步累加相对位姿来完成全局定位及地图构建，所以会产生较大的累积误差。鉴于深度神经网络在图像处理任务中展现的优越性，本文通过在视觉SLAM系统中引入由深度神经网络构建的特征匹配器及对应的特征点提取器来提高位姿估计精度，引入由深度神经网络构建的回环检测器来消除系统的累积误差。本文的研究内容如下：（1）将SuperPoint特征点提取网络和SuperGlue特征点匹配网络重构为SG-Detector模块和SG-Matcher模块，然后将SG-Detector作为特征点提取器，将SG-Matcher作为特征点匹配器，再结合多帧信息融合位姿估计算法，设计了一个新型的前端视觉里程计。（2）设计了一个新型的回环修正模块。该模块使用Seq-CALC轻量级回环检测网络进行回环检测，使用SG-Matcher来进行帧间匹配来计算回环位姿修正量，并在位姿图(pose graph)上传播位姿修正量，从而消除累积误差。（3）在所设计的前端视觉里程计和回环修正模块的基础上，加上对应的后端优化模块、地图维护模块、可视化模块设计了一个完整的融合多个深度神经网络的视觉SLAM系统。并在KITTI数据集上对系统进行了充分的实验，最终证明了所设计的视觉SLAM系统不仅在精度方面超越了许多现存的视觉SLAM系统，还可以实现实时运行。

关键词

图像处理/视觉SLAM/特征点匹配/深度神经网络

引用本文复制引用

授予学位

硕士

学科专业

机械工程

导师

于爱华

学位年度

2023

学位授予单位

浙江科技学院

语种

中文

中图分类号

段落导航