首页|基于强化学习的四足机器人牵引运动控制研究

基于强化学习的四足机器人牵引运动控制研究

扫码查看
针对四足机器人在拖拽运动控制中高度依赖于动力学模型精确度的问题,提出一种基于双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient,TD3)的四足机器人拖拽运动的控制方法.通过分析四足机器人拖拽模型,建立其拖拽运动的训练环境;采用TD3算法搭建四足机器人拖拽运动控制模型,通过MATLAB Simulation R2022的运动仿真,验证该控制器的可行性,并对实验数据进行对比分析.结果表明:在无拖拽且缺少先验知识条件下,采用该控制策略达到稳态的时间比采用深度确定性策略梯度算法(deep deterministic poli-cy gradient,DDPG)的控制策略所用训练周期缩短了2/3;在加载0.4 kg拖拽重物的条件下,该控制策略下的四足机器人平均速度下降幅度较小,各关节扭矩平稳顺滑,姿态角在可控范围内.
Research on traction motion control of quadruped robots based on reinforcement learning

秦建军、孟圆、曹钰、江磊、苏波

展开 >

北京建筑大学 机电与车辆工程学院, 北京 100044

北京市建筑安全监测工程技术研究中心, 北京 100044

中国北方车辆研究所, 北京 100072

深度强化学习 四足机器人 拖拽运动 TD3

国家自然科学基金北京市属高校基本科研业务费专项北京建筑大学研究生创新项目北京市建筑安全监测工程技术研究中心研究基金

91748211X20060PG2021088BJC2020K012

2022

重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
年,卷(期):2022.36(12)
  • 4