摘要
针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient,DDPG)的控制算法,以更好地解决 6 轴机械臂在三维空间中的控制难题.在MuJoCo平台上建立仿真环境,引入所设计机械臂为测试对象,并采用DDPG算法、柔性动作-评估算法(soft actor-critic algorithms,SAC)和双延迟深度确定策略梯度算法(twin delayed deep deterministic policy gradient,TD3)对仿真环境下的机械臂进行了几组对比测试.研究表明:以DDPG算法为基础的机械臂控制方法能够有效地提高机械臂的控制精度,相对于SAC、TD3 等算法稳定性较好.
基金项目
重庆市基础科学与前沿技术研究专项课题(cstc2020jcyjmsxmX0331)
重庆市教育委员会科学技术研究计划青年项目(KJQN202101144)