现代计算机2022,Vol.28Issue(2) :67-72.DOI:10.3969/j.issn.1007-1423.2022.02.010

基于改进Q-Learning的路径规划算法

Path Planning Algorithm Based on Improved Q-Learning

张小月 韩尚君 陶青川 余艳梅
现代计算机2022,Vol.28Issue(2) :67-72.DOI:10.3969/j.issn.1007-1423.2022.02.010

基于改进Q-Learning的路径规划算法

Path Planning Algorithm Based on Improved Q-Learning

张小月 1韩尚君 1陶青川 1余艳梅1
扫码查看

作者信息

  • 1. 四川大学电子信息学院,成都 610065
  • 折叠

摘要

Q-Learning是一种经典的强化学习算法.然而,它存在着收敛速度慢的缺点,而且由于存在着一定概率的探索,该算法可能会浪费很多时间.为解决这些问题,在Q-learning基础上引入初始化Q表格,同时提出"探索引导"方法.仿真实验结果表明,该改进可以减少训练次数,加快收敛速度,例如在Gym库中的悬崖寻路场景中,改进的方法能缩短30%的训练次数.

关键词

强化学习/Q-Learning/路径规划

引用本文复制引用

出版年

2022
现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
被引量2
参考文献量6
段落导航相关论文