重庆理工大学学报2022,Vol.36Issue(12) :80-91.DOI:10.3969/j.issn.1674-8425(z).2022.12.010

基于强化学习的四足机器人牵引运动控制研究

Research on traction motion control of quadruped robots based on reinforcement learning

秦建军 孟圆 曹钰 江磊 苏波
重庆理工大学学报2022,Vol.36Issue(12) :80-91.DOI:10.3969/j.issn.1674-8425(z).2022.12.010

基于强化学习的四足机器人牵引运动控制研究

Research on traction motion control of quadruped robots based on reinforcement learning

秦建军 1孟圆 1曹钰 1江磊 2苏波2
扫码查看

作者信息

  • 1. 北京建筑大学 机电与车辆工程学院, 北京 100044;北京市建筑安全监测工程技术研究中心, 北京 100044
  • 2. 中国北方车辆研究所, 北京 100072
  • 折叠

摘要

针对四足机器人在拖拽运动控制中高度依赖于动力学模型精确度的问题,提出一种基于双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient,TD3)的四足机器人拖拽运动的控制方法.通过分析四足机器人拖拽模型,建立其拖拽运动的训练环境;采用TD3算法搭建四足机器人拖拽运动控制模型,通过MATLAB Simulation R2022的运动仿真,验证该控制器的可行性,并对实验数据进行对比分析.结果表明:在无拖拽且缺少先验知识条件下,采用该控制策略达到稳态的时间比采用深度确定性策略梯度算法(deep deterministic poli-cy gradient,DDPG)的控制策略所用训练周期缩短了2/3;在加载0.4 kg拖拽重物的条件下,该控制策略下的四足机器人平均速度下降幅度较小,各关节扭矩平稳顺滑,姿态角在可控范围内.

关键词

深度强化学习/四足机器人/拖拽运动/TD3

引用本文复制引用

基金项目

国家自然科学基金(91748211)

北京市属高校基本科研业务费专项(X20060)

北京建筑大学研究生创新项目(PG2021088)

北京市建筑安全监测工程技术研究中心研究基金(BJC2020K012)

出版年

2022
重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
参考文献量4
段落导航相关论文