中国安全科学学报2023,Vol.33Issue(8) :68-76.DOI:10.16265/j.cnki.issn1003-3033.2023.08.0038

基于深度强化学习的无人机线路及航迹协同规划

UAV distribution route and flight path collaborative planning based on deep reinforcement learning

魏明 孙雅茹 孙博 王盛杰
中国安全科学学报2023,Vol.33Issue(8) :68-76.DOI:10.16265/j.cnki.issn1003-3033.2023.08.0038

基于深度强化学习的无人机线路及航迹协同规划

UAV distribution route and flight path collaborative planning based on deep reinforcement learning

魏明 1孙雅茹 2孙博 2王盛杰3
扫码查看

作者信息

  • 1. 中国民航大学空中交通管理学院,天津 300300;中国民用航空飞行学院民航飞行技术与飞行安全重点实验室,四川广汉 618300
  • 2. 中国民航大学空中交通管理学院,天津 300300
  • 3. 中国民用航空飞行学院民航飞行技术与飞行安全重点实验室,四川广汉 618300
  • 折叠

摘要

为优化物流无人机(UAV)的配送线路以及航迹协同规划,在地理信息系统(GIS)栅格化基础上,考虑调度中心、客户和地面遮蔽物的位置空间分布,以及它们的坠落代价差异,提出一种UAV配送线路以及航迹协同规划的双层规划模型;根据问题特征,设计一种基于深度强化学习(DRL)的2阶段混合算法,在第1阶段利用DRL算法生成多架UAV访问客户顺序的配送线路,再将A*算法嵌入其中,据此在第2阶段搜索每架UAV的可行最短航迹;结合算例,给出最佳UAV配送线路及其航迹方案,分析参数的变化对模型的影响,并与传统智能算法比较,验证所提模型的科学性和有效性.结果表明:对于6 km×6 km区域内30客户点规模的算例,设置人机的坠落代价阈值为1.4时,完成配送任务需要5架UAV,总飞行里程52.5km;与多种传统智能算法相比,求解时间从少到多依次排名为DRL、遗传算法(GA)、差分进化算法(DE)和粒子群算法(PSO),在大规模算例上,DRL的规划结果UAV运行成本更低,其平均解和最差解远优于智能算法.

关键词

深度强化学习(DRL)/无人机(UAV)/配送线路/航迹规划/双层规划模型

Key words

deep reinforcement learning(DRL)/unmanned aerial vehicle(UAV)/distribution route/flight path planning/bi-level programming model

引用本文复制引用

基金项目

教育部人文社科项目(20YJCZH176)

民航飞行技术与飞行安全重点实验室开放基金(FZ2021KF06)

出版年

2023
中国安全科学学报
中国职业安全健康协会

中国安全科学学报

CSTPCDCSCD北大核心
影响因子:1.548
ISSN:1003-3033
被引量2
参考文献量4
段落导航相关论文