摘要
随着雷达电子智能对抗技术的发展,雷达需要高效准确地采取针对特定干扰的最优抗干扰方法。强化学习(ReinforcementLearning,RL)拥有强大的决策能力,可针对不同的干扰类型,准确快速地选择出最佳抗干扰措施。深度学习(DeepLearning,DL)拥有强大的学习能力,可以快速地学习到不同干扰间的特征,两者结合使用可以使雷达更加准确、快速及智能地做出抗干扰决策。本文针对传统雷达系统无法针对特定干扰类型选择相对应抗干扰方法的问题,提出基于强化学习和深度强化学习(DeepReinforcementLearning,DRL)算法的雷达抗干扰智能决策方法。主要工作和研究成果如下: 1、介绍了强化学习理论和深度强化学习理论。使用RL决策算法生成决策Q值表,基于Q值表针对每种干扰样式做出智能决策,选择其最佳抗干扰方法,使传统雷达抗干扰脱离人工操控,提高了雷达抗干扰的智能化程度。 2、使用DRL算法解决RL无法处理大量数据的问题,利用对抗过程中生成的样本数据训练卷积神经网络,并得到干扰的Q值矩阵,将其作为雷达选择最佳抗干扰方法的依据,最终得到训练完备的抗干扰智能决策模块。引入DRL算法可以提高系统处理大数据的能力,通过对比,基于深度强化学习的智能决策方法的决策性能最优。 3、论文的核心是抗干扰智能决策模块的设计与训练,主要过程包括构建对抗环境、数据处理、设计决策方法。基于RL和DRL算法的智能决策策略相较于随机选择策略,抗干扰正确率和实时性均有所提高,并且DRL方法具有处理大型数据的能力和较高的鲁棒性,使其具有很大的工程价值。