计算机时代2023,Issue(11) :90-93.DOI:10.16644/j.cnki.cn33-1094/tp.2023.11.018

基于双延迟深度确定性策略梯度的卫星远程变轨控制

Satellite remote orbit change control based on twin delayed deep deterministic policy gradient

邱鹏鹏 张易诚 曹海涛 郑君铮
计算机时代2023,Issue(11) :90-93.DOI:10.16644/j.cnki.cn33-1094/tp.2023.11.018

基于双延迟深度确定性策略梯度的卫星远程变轨控制

Satellite remote orbit change control based on twin delayed deep deterministic policy gradient

邱鹏鹏 1张易诚 1曹海涛 1郑君铮2
扫码查看

作者信息

  • 1. 浙江理工大学计算机科学与技术学院,浙江 杭州 310018
  • 2. 浙江理工大学信息科学与工程学院
  • 折叠

摘要

在间断性点火与小脉冲作用下的卫星,实现椭圆轨道转移极具困难.因此引入深度强化学习双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient algorithm,TD3),实现了卫星的远程变轨控制.首先建立合理的卫星变轨模型;其次利用TD3算法来模拟卫星点火操作,同时通过设计多种奖励函数引导卫星不断学习,最终到达目标轨道附近;最后通过仿真实验验证了所提TD3算法能够有效控制卫星到达目标轨道附近.

关键词

变轨控制/相对运动/目标轨道/深度强化学习

Key words

orbit change control/relative motion/target orbit/deep reinforcement learning

引用本文复制引用

出版年

2023
计算机时代
浙江省计算技术研究所 浙江省计算机学会

计算机时代

影响因子:0.411
ISSN:1006-8228
参考文献量3
段落导航相关论文