摘要
本发明公开了一种回合制轨道追逃博弈的智能控制方法,包括:对回合制轨道追逃博弈过程进行分析,建立回合制轨道追逃博弈问题模型;基于回合制轨道追逃博弈问题模型,针对回合制轨道追逃博弈建立对应的回合制马尔科夫决策过程,设计回合制轨道追逃博弈中双方的奖励函数;根据双方的奖励函数,利用MADDPG对回合制轨道追逃博弈智能控制的策略网络进行训练;追逃双方航天器利用训练好的策略网络,根据自身对环境的观测信息输出控制指令,实现回合制轨道追逃博弈的智能控制。本发明充分考虑了轨道动力学约束、非完备信息约束以及航天器轨道机动特点,更加符合实际空间场景,在回合制轨道追逃博弈建模及策略设计方面具有重要价值。