首页|基于启发式强化学习的移动机器人路径规划算法研究

基于启发式强化学习的移动机器人路径规划算法研究

扫码查看
针对移动机器人采用强化学习方法进行路径规划时存在的学习效率低及收敛速度慢等问题,提出一种改进的Q-learning算法.首先提出动态动作集策略,根据机器人当前点与终点的位置来选择其动作集;然后在算法中加入启发式奖惩函数,使得机器人采取不同的动作收获不同的奖励.由此来改进算法,进而提高算法的学习效率,加快算法收敛.最后在栅格环境下进行仿真实验,结果表明本文改进算法较传统的Q-learning算法,很大程度上加快了算法的收敛速度.
Research on Path Planning Algorithm of Mobile Robot Based on Heuristic Reinforcement Learning

潘国倩、周新志

展开 >

四川大学电子信息学院,成都 610065

移动机器人 路径规划 Q-learning算法

中国民用航空局民航联合研究基金

U1933123

2022

现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
年,卷(期):2022.28(10)
  • 2
  • 5