基于改进Q学习的机械臂实时障碍规避方法

扫码查看

原文链接

NETL
NSTL
万方数据
维普

中文摘要：为了提高实时机械臂规避障碍物的适应性,提出一种基于改进Q学习的控制规避方法.首先,利用深度增强学习对机械臂动作给予奖励和惩罚,并通过深度神经网络学习特征表示.然后,采用状态和动作集合以及环境迁移概率矩阵定义马尔科夫决策过程;同时,将归一化优势函数与Q学习算法相结合,以支持在连续空间中定义的机器人系统.实验结果表明:所提方法解决了Q学习收敛速度慢的缺点,实现了高性能机械臂的实时避障,有助于实现人机安全共存.

外文标题：Real-time Obstacle Avoidance of Robotic Manipulator Based on Improved Q-learning

作者：

吴戴燕、刘世林

展开 >

作者单位：

安徽六安技师学院机电工程系,安徽六安 237001

安徽工程大学电子工程学院,安徽芜湖 241000

关键词：

机械臂马尔科夫决策深度增强学习 Q学习归一化优势函数

基金：

安徽省高等学校自然科学研究重大项目安徽省高等学校自然科学研究重点项目

项目编号：

KJ2018ZD066KJ2019A1184

出版年：

2022

DOI：

10.13853/j.cnki.issn.1672-3708.2022.06.003

台州学院学报

台州学院

台州学院学报

CHSSCD

影响因子：0.283

ISSN：1672-3708

年,卷(期)：2022.44(6)

参考文献量6