首页|基于双延迟深度确定性策略梯度的卫星远程变轨控制

基于双延迟深度确定性策略梯度的卫星远程变轨控制

扫码查看
在间断性点火与小脉冲作用下的卫星,实现椭圆轨道转移极具困难.因此引入深度强化学习双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient algorithm,TD3),实现了卫星的远程变轨控制.首先建立合理的卫星变轨模型;其次利用TD3算法来模拟卫星点火操作,同时通过设计多种奖励函数引导卫星不断学习,最终到达目标轨道附近;最后通过仿真实验验证了所提TD3算法能够有效控制卫星到达目标轨道附近.
Satellite remote orbit change control based on twin delayed deep deterministic policy gradient

orbit change controlrelative motiontarget orbitdeep reinforcement learning

邱鹏鹏、张易诚、曹海涛、郑君铮

展开 >

浙江理工大学计算机科学与技术学院,浙江 杭州 310018

浙江理工大学信息科学与工程学院

变轨控制 相对运动 目标轨道 深度强化学习

2023

计算机时代
浙江省计算技术研究所 浙江省计算机学会

计算机时代

影响因子:0.411
ISSN:1006-8228
年,卷(期):2023.(11)
  • 3