基于强化学习的小型ROV运动控制算法的研究

黄兆军¹

扫码查看

作者信息

1. 珠海城市职业技术学院,广东珠海,519090
折叠

摘要

本文首先介绍了强化学习在无人遥控水下机器人(ROV)运动控制方面的研究现状,指出目前阻碍其进一步应用的共性难题,并对深度强化学习算法中的深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法的基本原理进行了阐述;然后针对DDPG算法应用于ROV运动控制时所存在的坏样本影响学习稳定性和缺少环境探索能力的问题,从神经网络结构和噪声引入两个方面对该算法进行了改进,提出了基于均值策略的混合式神经网络结构和引入参数空间噪声的方法;最后进行仿真实验,实验结果证明:本文改进型DDPG算法比常规的DDPG算法和传统的PID控制算法更加有效.

关键词

小型ROV/强化学习/深度确定性策略梯度/混合式神经网络/参数噪声/运动控制

引用本文复制引用

出版年

2024

机器人技术与应用

国家863机器人技术主题专家组　北方科技信息研究所

机器人技术与应用

影响因子：0.289

ISSN：1004-6437

段落导航