国家学术搜索
登录
注册
中文
EN
首页
|
基于改进Q-Learning的路径规划算法
基于改进Q-Learning的路径规划算法
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
Q-Learning是一种经典的强化学习算法.然而,它存在着收敛速度慢的缺点,而且由于存在着一定概率的探索,该算法可能会浪费很多时间.为解决这些问题,在Q-learning基础上引入初始化Q表格,同时提出"探索引导"方法.仿真实验结果表明,该改进可以减少训练次数,加快收敛速度,例如在Gym库中的悬崖寻路场景中,改进的方法能缩短30%的训练次数.
外文标题:
Path Planning Algorithm Based on Improved Q-Learning
收起全部
展开查看外文信息
作者:
张小月、韩尚君、陶青川、余艳梅
展开 >
作者单位:
四川大学电子信息学院,成都 610065
关键词:
强化学习
Q-Learning
路径规划
出版年:
2022
DOI:
10.3969/j.issn.1007-1423.2022.02.010
现代计算机
中大控股
现代计算机
影响因子:
0.292
ISSN:
1007-1423
年,卷(期):
2022.
28
(2)
被引量
2
参考文献量
6