重庆理工大学学报2023,Vol.37Issue(17) :134-140.DOI:10.3969/j.issn.1674-8425(z).2023.09.015

一种基于DDPG算法的6轴机械臂控制研究

Research on the control of a six-axis robotic arm using the DDPG algorithm

何联格 李天华 聂远航 妥吉英
重庆理工大学学报2023,Vol.37Issue(17) :134-140.DOI:10.3969/j.issn.1674-8425(z).2023.09.015

一种基于DDPG算法的6轴机械臂控制研究

Research on the control of a six-axis robotic arm using the DDPG algorithm

何联格 1李天华 2聂远航 2妥吉英3
扫码查看

作者信息

  • 1. 重庆理工大学 汽车零部件先进制造技术教育部重点实验室,重庆 400054;北京信息科技大学 现代测控技术教育部重点实验室,北京 100192;重庆青山工业有限责任公司,重庆 402761
  • 2. 重庆理工大学 汽车零部件先进制造技术教育部重点实验室,重庆 400054
  • 3. 重庆理工大学 汽车零部件先进制造技术教育部重点实验室,重庆 400054;重庆青山工业有限责任公司,重庆 402761
  • 折叠

摘要

针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient,DDPG)的控制算法,以更好地解决 6 轴机械臂在三维空间中的控制难题.在MuJoCo平台上建立仿真环境,引入所设计机械臂为测试对象,并采用DDPG算法、柔性动作-评估算法(soft actor-critic algorithms,SAC)和双延迟深度确定策略梯度算法(twin delayed deep deterministic policy gradient,TD3)对仿真环境下的机械臂进行了几组对比测试.研究表明:以DDPG算法为基础的机械臂控制方法能够有效地提高机械臂的控制精度,相对于SAC、TD3 等算法稳定性较好.

关键词

6自由度/机械臂/控制/强化学习/DDPG

Key words

six degrees of freedom/robotic arm/control/reinforcement learning/DDPG

引用本文复制引用

基金项目

重庆市基础科学与前沿技术研究专项课题(cstc2020jcyjmsxmX0331)

重庆市教育委员会科学技术研究计划青年项目(KJQN202101144)

出版年

2023
重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
参考文献量2
段落导航相关论文