首页|一种基于DDPG算法的6轴机械臂控制研究

一种基于DDPG算法的6轴机械臂控制研究

Research on the control of a six-axis robotic arm using the DDPG algorithm

扫码查看
针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient,DDPG)的控制算法,以更好地解决 6 轴机械臂在三维空间中的控制难题.在MuJoCo平台上建立仿真环境,引入所设计机械臂为测试对象,并采用DDPG算法、柔性动作-评估算法(soft actor-critic algorithms,SAC)和双延迟深度确定策略梯度算法(twin delayed deep deterministic policy gradient,TD3)对仿真环境下的机械臂进行了几组对比测试.研究表明:以DDPG算法为基础的机械臂控制方法能够有效地提高机械臂的控制精度,相对于SAC、TD3 等算法稳定性较好.

six degrees of freedomrobotic armcontrolreinforcement learningDDPG

何联格、李天华、聂远航、妥吉英

展开 >

重庆理工大学 汽车零部件先进制造技术教育部重点实验室,重庆 400054

北京信息科技大学 现代测控技术教育部重点实验室,北京 100192

重庆青山工业有限责任公司,重庆 402761

6自由度 机械臂 控制 强化学习 DDPG

重庆市基础科学与前沿技术研究专项课题重庆市教育委员会科学技术研究计划青年项目

cstc2020jcyjmsxmX0331KJQN202101144

2023

重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
年,卷(期):2023.37(17)
  • 2