基于强化学习的四足机器人牵引运动控制研究

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据

中文摘要：针对四足机器人在拖拽运动控制中高度依赖于动力学模型精确度的问题,提出一种基于双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient,TD3)的四足机器人拖拽运动的控制方法.通过分析四足机器人拖拽模型,建立其拖拽运动的训练环境;采用TD3算法搭建四足机器人拖拽运动控制模型,通过MATLAB Simulation R2022的运动仿真,验证该控制器的可行性,并对实验数据进行对比分析.结果表明:在无拖拽且缺少先验知识条件下,采用该控制策略达到稳态的时间比采用深度确定性策略梯度算法(deep deterministic poli-cy gradient,DDPG)的控制策略所用训练周期缩短了2/3;在加载0.4 kg拖拽重物的条件下,该控制策略下的四足机器人平均速度下降幅度较小,各关节扭矩平稳顺滑,姿态角在可控范围内.

外文标题：Research on traction motion control of quadruped robots based on reinforcement learning

作者：

秦建军、孟圆、曹钰、江磊、苏波

展开 >

作者单位：

北京建筑大学机电与车辆工程学院, 北京 100044

北京市建筑安全监测工程技术研究中心, 北京 100044

中国北方车辆研究所, 北京 100072

关键词：

深度强化学习四足机器人拖拽运动 TD3

基金：

国家自然科学基金北京市属高校基本科研业务费专项北京建筑大学研究生创新项目北京市建筑安全监测工程技术研究中心研究基金

项目编号：

91748211X20060PG2021088BJC2020K012

出版年：

2022

DOI：

10.3969/j.issn.1674-8425(z).2022.12.010

重庆理工大学学报

重庆理工大学

重庆理工大学学报

CSTPCD北大核心

影响因子：0.567

ISSN：1674-8425

年,卷(期)：2022.36(12)

参考文献量4