基于改进Q-Learning的路径规划算法

扫码查看

原文链接

NETL
NSTL
万方数据
维普

中文摘要：Q-Learning是一种经典的强化学习算法.然而,它存在着收敛速度慢的缺点,而且由于存在着一定概率的探索,该算法可能会浪费很多时间.为解决这些问题,在Q-learning基础上引入初始化Q表格,同时提出"探索引导"方法.仿真实验结果表明,该改进可以减少训练次数,加快收敛速度,例如在Gym库中的悬崖寻路场景中,改进的方法能缩短30％的训练次数.

外文标题：Path Planning Algorithm Based on Improved Q-Learning

作者：

张小月、韩尚君、陶青川、余艳梅

展开 >

作者单位：

四川大学电子信息学院,成都 610065

关键词：

强化学习 Q-Learning 路径规划

出版年：

2022

DOI：

10.3969/j.issn.1007-1423.2022.02.010