面向协作SLAM的多机器人系统学习方法研究

裴昭义¹

扫码查看

作者信息

1. 哈尔滨工业大学
折叠

摘要

协作同时定位与建图（SimultaneousLocalizationandMapping,SLAM）是指多个机器人在未知环境中通过协作，实现同时定位与环境地图创建的技术。协作SLAM被广泛应用于大规模环境建图，但是对系统总体协调效率以及机器人个体之间的协作能力要求非常高。因此，将多机器人系统学习方法应用于协作SLAM成为近年来的研究热点。但是现有方法存在着学习目的及方法单一，无法解决多机器人系统由于任务类型复杂多样而造成难以学习的问题。本文对面向协作SLAM的多机器人系统学习方法进行了深入研究，研究内容主要涉及多机器人任务分配、多机器人协作定位、及多机器人协作建图。多机器人协作SLAM由上述三个部分组成，多机器人协作定位与建图指的是多机器人利用任务分配算法来协调多个机器人进行主动相互定位与探索地图，定位和建图的结果会反馈至任务分配单元，系统会根据SLAM的结果对机器人进行任务分配。本文主要研究内容包括以下三个部分：提出了基于神经网络和AGRMF（AgentGroupRoleMembershipFunction）的多机器人任务分配算法，解决了多机器人系统学习机器人能力特征效率低的问题。首先，本文提出了由特征提取层和联盟生成层两部分组成的AGRMF-NN神经网络。多机器人系统学习到每个机器人的AGRMF个体特征后，会将其传递至AGRMF-NN特征提取层，并提取出所有机器人的AGRMF角色特征，然后将AGRMF角色特征传递到基于自组织映射的联盟生成层，由联盟生成层学习AGRMF任务分组特征并对所有机器人进行分组。其次，本文提出了组吸引力函数来评估联盟质量以及机器人的贡献程度。最后，本文提出了基于组吸引力函数的学习算法来更新AGRMF-NN的所有权值。仿真实验表明，所提算法提高了多机器人系统学习机器人能力特征以及执行任务的效率。提出了基于定位协助度的多机器人协作定位算法，解决了多机器人系统协作定位时定位精度低的问题。首先，根据多机器人协作定位中观测信息可传递的特点，提出了多机器人链式定位算法，在链式定位的过程中，机器人独立运行SLAM的同时，以相对观测的形式对目标机器人进行协作定位，定位链中的每个成员在系统的整体调度下参与各自目标机器人的链式定位。其次，提出了最优定位链的定义。最后，提出了最优定位链的学习算法以及基于最优定位链的多机器人协作链式定位算法。仿真实验表明，所提算法提高了多机器人协作定位的精度。提出了基于深度强化学习的多机器人协作SLAM算法，解决了多机器人系统因没有提取并学习机器人协作SLAM特征而导致的定位及建图精度低的问题。首先，构建面向多机器人协作SLAM的任务树，并利用分层强化学习模型来计算整个多机器人系统的协作SLAM效用值。其次，提出了对整个多机器人系统建模的观察函数，以获取多机器人系统的定位及建图的状态。最后，提出了基于多机器人系统协作SLAM效用值的奖励函数，并且构建了MAS-DQN网络，用其学习系统累积的SLAM效用值以及多机器人系统中的SLAM属性和协作特征。仿真实验表明，所提算法改善了多机器人系统的定位精度和探索地图的效果。综上所述，本文围绕面向协作SLAM的多机器人系统学习方法相关问题展开研究，提出了多机器人任务分配方法、协作定位方法以及多机器人协作SLAM方法，提高了多机器人协作SLAM的定位和建图的精度。

关键词

多机器人系统/协作SLAM/深度强化学习/神经网络

引用本文复制引用

授予学位

博士

学科专业

计算机应用技术

导师

朴松昊

学位年度

2022

学位授予单位

哈尔滨工业大学

语种

中文

中图分类号

段落导航