基于多智能体强化学习的水下仿生机器人协同围捕

冯育凯 ¹吴正兴 ¹余涟祎 ¹谭民¹

扫码查看

作者信息

1. 中国科学院自动化研究所,北京 100190;中国科学院大学,北京 100049
折叠

摘要

近年来,水下仿生机器人的协同围捕研究受到了广泛的关注.然而,由于水下环境的复杂性和多变性,以及这类仿生机器人的特殊运动模式,导致该研究面临着众多的技术难题.针对这些难题,本文提出了一种基于多智能体强化学习的水下仿生机器人协同围捕策略,完成了相关实验验证.具体而言,本文设计了一个基于多智能体深度确定性策略梯度网络的围捕策略训练框架,针对水下围捕任务的需求,设计了相应的奖励函数,提升了围捕策略的训练效果.考虑到水下仿生机器人在运动和控制上的特点,本文制定了相应的状态转换规则,从而使策略能够很好地迁移到实际应用中.经过一系列实验测试表明,所提出的策略能够显著提高水下协同围捕任务的成功率及稳定性.本研究有效提高了水下仿生机器人集群协同围捕任务的效率和能力,为水下仿生机器人集群的协同控制提供了重要的理论基础和技术支撑.

关键词

水下仿生机器人/多机器人系统/多智能体强化学习

引用本文复制引用

出版年

2024

人工智能

ISSN：2096-5036

段落导航