基于ORB-SLAM2与深度学习的单目语义建图方法研究

赵雪娇¹

扫码查看

作者信息

1. 哈尔滨工程大学
折叠

摘要

近年来，同时定位与地图构建(SimultaneousLocalizationandMapping，SLAM)技术日益成熟，但是场景对语义的需求越来越迫切，语义信息在移动机器人的定位与导航等任务中至关重要。本文提出一种室内单目语义SLAM框架，仅通过结构简单且成本低廉的单目相机，实现机器对三维场景的理解。采用优化的深度学习目标检测网络，完成更精确的语义信息获取;通过基于深度学习的单目深度估计网络，克服ORB-SLAM2深度估计模块的瓶颈;在真实场景下运行本文框架，证明深度学习与SLAM技术结合的可行性。围绕单目语义地图构建，本文做了以下研究: (1)针对ORB-SLAM2框架中三角测量的缺点，采用深度学习方式完成深度估计，解决了传统三角测量方法的矛盾以及纯旋转时无法估计深度的问题。针对直接使用全卷积网络(FullyConvolutionalNetwork,FCN)深度估计精度不足的问题，本文提出一种改进的深度估计网络，以ResNet50作为主干网络，基于多尺度卷积设计了级联式和并行式2种上采样层，可以融合各层信息以细化深度预测结果。此外，对数据集进行数据扩充，以提高模型的泛化能力。通过实验验证了本文设计的并行式上采样层能够有效提升深度预测的精度。 (2)基于两阶段的FasterR-CNN网络实现ORB-SLAM2框架中关键帧的目标检测，网络能够检测9种类别的目标。为获取较为精细的语义信息，选择Inception_resnet_v2作为FasterR-CNN的主干网络，并对区域建议网络(RegionProposalNetwork，RPN)中的anchor机制进行优化，统计数据集中的目标性质，根据统计结果重新设计了anchor的尺寸和数量。实验结果表明，针对数据集合理地设计anchor机制，可以有效改善目标检测性能。 (3)在台式机上对本文设计的室内单目语义SLAM框架进行了实验。在官方TUM数据集上运行本文框架，验证了本文框架的可行性;使用自己制作的真实场景数据，对本文改进的深度估计网络和优化的目标检测网络进行测试。实验结果表明，两个网络均可以有效应用在真实场景中，将获取的二维语义信息映射到三维空间，在真实场景下实现了本文框架，证明了本文框架的有效性。

关键词

移动机器人/同时定位与地图构建/深度学习/单目深度估计/目标检测

引用本文复制引用

授予学位

硕士

学科专业

信息与通信工程

导师

侯长波

学位年度

2021

学位授予单位

哈尔滨工程大学

语种

中文

中图分类号

段落导航