魅力中国2020,Issue(3) :311.

探究磁导航AGV深度强化学习路径跟踪控制方法

杨雯
魅力中国2020,Issue(3) :311.

探究磁导航AGV深度强化学习路径跟踪控制方法

杨雯1
扫码查看

作者信息

  • 1. 山东爱普电气设备有限公司,山东 济南 250101
  • 折叠

摘要

在系统参数未知的情况下,磁导航AGV路径跟踪控制器的设计中,为了免除大量的人工参数整定工作,使用了改进的免模型深度强化学习算法设计了路径跟踪控制器.在建立磁导航AGV离散时域的运动学和动力学模型的基础上,将路径跟踪问题建模为连续状态与动作空间的马尔可夫决策过程.使用2个深度神经网络用于实现一个演员评判家架构的异策略免模型强化学习算法作为控制器的实现,分别采用时域差分法与确定性策略梯度算法用于对动作值函数与策略函数的参数更新.仿真结果表明:设计的控制器可自主从经验中学习到表现优异的控制规则.

关键词

自动导引车/路径跟踪/强化学习/深度强化学习

引用本文复制引用

出版年

2020
魅力中国
河南人民广播电台

魅力中国

ISSN:1673-0992
参考文献量2
段落导航相关论文