一种基于DDPG算法的6轴机械臂控制研究

Research on the control of a six-axis robotic arm using the DDPG algorithm

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据

中文摘要：针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient,DDPG)的控制算法,以更好地解决 6 轴机械臂在三维空间中的控制难题.在MuJoCo平台上建立仿真环境,引入所设计机械臂为测试对象,并采用DDPG算法、柔性动作-评估算法(soft actor-critic algorithms,SAC)和双延迟深度确定策略梯度算法(twin delayed deep deterministic policy gradient,TD3)对仿真环境下的机械臂进行了几组对比测试.研究表明:以DDPG算法为基础的机械臂控制方法能够有效地提高机械臂的控制精度,相对于SAC、TD3 等算法稳定性较好.

外文关键词：

six degrees of freedomrobotic armcontrolreinforcement learningDDPG

作者：

何联格、李天华、聂远航、妥吉英

展开 >

作者单位：

重庆理工大学汽车零部件先进制造技术教育部重点实验室,重庆 400054

北京信息科技大学现代测控技术教育部重点实验室,北京 100192

重庆青山工业有限责任公司,重庆 402761

关键词：

6自由度机械臂控制强化学习 DDPG

基金：

重庆市基础科学与前沿技术研究专项课题重庆市教育委员会科学技术研究计划青年项目

项目编号：

cstc2020jcyjmsxmX0331KJQN202101144

出版年：

2023

DOI：

10.3969/j.issn.1674-8425(z).2023.09.015

重庆理工大学学报

重庆理工大学

重庆理工大学学报

CSTPCD北大核心

影响因子：0.567

ISSN：1674-8425

年,卷(期)：2023.37(17)

参考文献量2