基于强化学习的无人机路径规划研究

袁乐忠¹

扫码查看

作者信息

1. 河北工程大学
折叠

摘要

无人机又被称为无人驾驶飞行器，在过去的几十年里，由于体积小、机动性高、持续作战能力强、操作简单、高可靠性、制造和维护成本低廉等特点，无人机已经被广泛应用于多种领域。具有出色的飞行性能是无人机能够成功执行各项复杂任务的前提，路径规划的优劣代表影响机器人的办事效率，所以近年来路径规划算法成为了近年来的研究热点。现有的路径规划主要分为几何模型算法，智能搜索算法，局部规划算法，人工智能以及混合算法5种算法。智能搜索算法最具代表性的为蚁群算法，粒子群算法，遗传算法，人工势场法，RRT算法以及PRM算法。人工智能算法主要为强化学习算法和深度学习算法。其中，强化学习中的Q-learning算法作为一种可以探索未知环境模型的算法在路径规划中表现优越，受到了学者们的关注。本文以强化学习和深度强化学习为理论基石，针对Q-learning算法在无人机路径规划中学习效率较低，收敛速度慢并且在较危险的障碍物区域判断易于出错的问题进行了改进和优化。通过运用栅格法，构建了一个无人机飞行的二维环境，采用经过改良的Q-learning算法对无人机进行路径规划，并进行仿真验证算法可行性。此外，为应对Q-learning算法在多维环境下的路径规划效果欠佳，极易出现维度灾难等问题，充分考虑了多维无人机飞行场景，对无人机的路径规划问题进行了深入研究。首先强调了无人机在飞行任务场景下进行路径规划的重要性，并针对此研究方向，梳理了现有的研究现状。现有的研究主要集中在利用深度强化学习的方法对多维状态下的无人机飞行任务路径进行规划。因此，本文构建了一个无人机飞行任务路径规划的模型，通过威胁模型的构造建立了一个多智能体的深度强化学习模型，提出了基于Q-learning的无人机飞行任务路径规划算法。

关键词

无人机/路径规划/强化学习

引用本文复制引用

授予学位

硕士

学科专业

控制工程

导师

张艳珠

学位年度

2024

学位授予单位

沈阳理工大学

语种

中文

中图分类号

段落导航