基于深度强化学习的舰载机动态避障方法

Dynamic Obstacle Avoidance Method for Carrier Aircraft Based on Deep Reinforcement Learning

薛均晓 ¹孔祥燕 ¹郭毅博 ²鲁爱国 ³李鉴 ³万曦 ³徐明亮²

扫码查看

作者信息

1. 郑州大学软件学院郑州 450002
2. 郑州大学信息工程学院郑州 450001
3. 中国船舶重工集团第 709 研究所武汉 430070
折叠

摘要

针对高度异构、动态的航母甲板作业场景中的舰载机避障问题,提出一种结合预测算法和深度强化学习的避障方法.该方法包含场景建模、奖励模型和轨迹预测模型等模块.首先基于智能体状态和动作空间对航母甲板场景进行建模;然后利用最小二乘法对场景中动态障碍物的位置进行实时轨迹预测,并构造了包含路径预测模块的深度强化学习方法——环境预测深度Q网络(PDQN);最后利用该方法实现航母甲板作业场景中的舰载机动态避障.利用Python绘图集Matplotlib进行仿真实验,实验数据结果表明,相比于Q-learning,SARSA等方法,所提方法的准确率提升了15％～25％,路径长度短9％～39％,平均奖励值高30％～100％,收敛速度快1～2倍且训练平稳后准确率的标准差小2％～50％.

关键词

航空母舰/强化学习/轨迹预测/动态避障

引用本文复制引用

基金项目

国家自然科学基金(62036010)

国家自然科学基金(61822701)

河南省高校科技创新人才支持计划(18HASTIT020)

出版年

2021

计算机辅助设计与图形学学报

中国计算机学会

计算机辅助设计与图形学学报

CSTPCDCSCD北大核心

影响因子：0.892

ISSN：1003-9775

被引量8

参考文献量26

段落导航