首页|基于强化学习的认知雷达目标跟踪波形挑选方法

基于强化学习的认知雷达目标跟踪波形挑选方法

Waveform Selection Method of Cognitive Radar Target Tracking Based on Reinforcement Learning

扫码查看
认知雷达通过不断与环境互动并从经验中学习,根据获得的知识不断调整其波形、参数和照射策略,以在复杂多变的场景中实现稳健的目标跟踪,其波形设计在提高跟踪性能方面一直备受关注.该文提出了一种用于跟踪高机动目标的认知雷达波形选择框架,该框架考虑了恒定速度(CV)、恒定加速度(CA)和协同转弯(CT)模型的组合,在该框架的基础上设计了基于准则优化(CBO)和熵奖励Q学习(ERQL)方法进行最优波形选择.该方法将雷达与目标集成到一个闭环中,发射波形随目标状态的变化实时更新,从而达到对目标的最佳跟踪性能.数值结果表明,与CBO方法相比,所提出的ERQL方法大大减少了获取最优波形的处理时间,并实现了与CBO相近的跟踪性能,相比于固定参数(Fixed-P)方法,极大地提高了机动目标的跟踪精度.

朱培坤、梁菁、罗子涵、沈晓峰

展开 >

电子科技大学信息与通信工程学院 成都 611731

目标跟踪 认知雷达 波形挑选 基于准则优化(CBO) 熵奖励Q学习(ERQL)

国家自然科学基金四川省自然科学基金111计划

617310062023NSFSC0450B17008

2023

雷达学报
中国科学院电子学研究所 中国雷达行业协会

雷达学报

CSTPCDCSCD北大核心EI
影响因子:0.667
ISSN:2095-283X
年,卷(期):2023.12(2)
  • 30