首页|伴随压制干扰与组网雷达功率分配的深度博弈研究

伴随压制干扰与组网雷达功率分配的深度博弈研究

扫码查看
传统的组网雷达功率分配一般在干扰模型给定的情况下进行优化,而干扰机资源优化是在雷达功率分配方式给定情况下,这样的研究缺乏博弈和交互.考虑到日益严重的雷达和干扰机相互博弈的作战场景,该文提出了伴随压制干扰下组网雷达功率分配深度博弈问题,其中智能化的目标压制干扰采用深度强化学习(DRL)训练.首先在该问题中干扰机和组网雷达被映射为两个智能体,根据干扰模型和雷达检测模型建立了压制干扰下组网雷达的目标检测模型和最大化目标检测概率优化目标函数.在组网雷达智能体方面,由近端策略优化(PPO)策略网络生成雷达功率分配向量;在干扰机智能体方面,设计了混合策略网络来同时生成波束选择动作和功率分配动作;引入领域知识构建更加有效的奖励函数,目标检测模型、等功率分配策略和贪婪干扰功率分配策略3种领域知识分别用于生成组网雷达智能体和干扰机智能体的导向奖励,从而提高智能体的学习效率和性能.最后采用交替训练方法来学习两个智能体的策略网络参数.实验结果表明;当干扰机采用基于DRL的资源分配策略时,采用基于DRL的组网雷达功率分配在目标检测概率和运行速度两种指标上明显优于基于粒子群的组网雷达功率分配和基于人工鱼群的组网雷达功率分配.
Deep Game of Escorting Suppressive Jamming and Networked Radar Power Allocation

Radar resource managementEscort suppression jammingDeep Reinforcement Learning(DRL)Detection probabilityDeep gameDomain knowledge assisted learning

王跃东、顾以静、梁彦、王增福、张会霞

展开 >

西北工业大学自动化学院 西安 710072

信息融合技术教育部重点实验室 西安 710072

雷达资源管理 伴随压制干扰 深度强化学习 检测概率 深度博弈 领域知识辅助学习

国家自然科学基金

61873205

2023

雷达学报
中国科学院电子学研究所 中国雷达行业协会

雷达学报

CSTPCDCSCD北大核心EI
影响因子:0.667
ISSN:2095-283X
年,卷(期):2023.12(3)
  • 3
  • 14