摘要
针对四足机器人在拖拽运动控制中高度依赖于动力学模型精确度的问题,提出一种基于双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient,TD3)的四足机器人拖拽运动的控制方法.通过分析四足机器人拖拽模型,建立其拖拽运动的训练环境;采用TD3算法搭建四足机器人拖拽运动控制模型,通过MATLAB Simulation R2022的运动仿真,验证该控制器的可行性,并对实验数据进行对比分析.结果表明:在无拖拽且缺少先验知识条件下,采用该控制策略达到稳态的时间比采用深度确定性策略梯度算法(deep deterministic poli-cy gradient,DDPG)的控制策略所用训练周期缩短了2/3;在加载0.4 kg拖拽重物的条件下,该控制策略下的四足机器人平均速度下降幅度较小,各关节扭矩平稳顺滑,姿态角在可控范围内.
基金项目
国家自然科学基金(91748211)
北京市属高校基本科研业务费专项(X20060)
北京建筑大学研究生创新项目(PG2021088)
北京市建筑安全监测工程技术研究中心研究基金(BJC2020K012)