首页|基于深度强化学习的防空武器目标分配问题研究

基于深度强化学习的防空武器目标分配问题研究

扫码查看
针对传统模型和算法难以解决防空作战指挥决策中存在的不确定性和非线性等问题,结合深度强化学习理论,构建了一种新型面向智能武器-目标分配的深度神经网络框架,引入双噪声和优先经验回放技术改进深度确定性策略梯度算法用以模型求解,并在地空对抗数字战场进行了仿真验证.实验结果显示,用该算法训练出的智能体能够更加合理高效地运用武器资源,验证了模型框架和算法的优越性和合理性.

李腾达、王刚、付强、刘家义

展开 >

空军工程大学

深度强化学习 马尔科夫决策 防空作战 改进型DDPG算法

国家自然科学基金国家自然科学基金陕西省自然科学基础研究计划

62106283720012142021JM-226

2024

军事运筹与评估
军事科学院军事运筹分析研究所

军事运筹与评估

CSTPCD
影响因子:0.315
ISSN:2097-1702
年,卷(期):2024.39(2)
  • 21