百科论坛电子杂志2020,Issue(15) :300.DOI:10.12253/j.issn.2096-3661.2020.15.572

弹道解算中多层精密气象简化算法

逯峤 贺朝阳 张珺璐 丁帅 李阳
百科论坛电子杂志2020,Issue(15) :300.DOI:10.12253/j.issn.2096-3661.2020.15.572

弹道解算中多层精密气象简化算法

逯峤 1贺朝阳 1张珺璐 1丁帅 1李阳1
扫码查看

作者信息

  • 1. 北方自动控制技术研究所
  • 折叠

摘要

提出了一种基于Markov决策过程的弹道导弹中段突防控制模型,并基于状态、动作对值函数建立了一种完全数据驱动的控制模型.为了加快深度神经网络的收敛速度、增强训练过程中的稳定性,引入了竞争架构和目标网络架构,设计了一种深度神经网络架构竞争双深度Q网络(D3Q).对传统深度Q网络(DQN)的强化学习算法中的记忆池生成方法进行了改进,提升了训练样本质量.训练及验证结果表明,该方法实现了D3Q网络对弹道导弹中段突防最优控制模型的逼近.

关键词

弹道导弹/深度强化学习/中段突防/策略/人工智能

引用本文复制引用

出版年

2020
百科论坛电子杂志

百科论坛电子杂志

ISSN:
参考文献量3
段落导航相关论文