摘要
针对传统模型和算法难以解决防空作战指挥决策中存在的不确定性和非线性等问题,结合深度强化学习理论,构建了一种新型面向智能武器-目标分配的深度神经网络框架,引入双噪声和优先经验回放技术改进深度确定性策略梯度算法用以模型求解,并在地空对抗数字战场进行了仿真验证.实验结果显示,用该算法训练出的智能体能够更加合理高效地运用武器资源,验证了模型框架和算法的优越性和合理性.
基金项目
国家自然科学基金(62106283)
国家自然科学基金(72001214)
陕西省自然科学基础研究计划(2021JM-226)