基于双延迟深度确定性策略梯度的卫星远程变轨控制

Satellite remote orbit change control based on twin delayed deep deterministic policy gradient

邱鹏鹏 ¹张易诚 ¹曹海涛 ¹郑君铮²

扫码查看

作者信息

1. 浙江理工大学计算机科学与技术学院,浙江杭州 310018
2. 浙江理工大学信息科学与工程学院
折叠

摘要

在间断性点火与小脉冲作用下的卫星,实现椭圆轨道转移极具困难.因此引入深度强化学习双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient algorithm,TD3),实现了卫星的远程变轨控制.首先建立合理的卫星变轨模型;其次利用TD3算法来模拟卫星点火操作,同时通过设计多种奖励函数引导卫星不断学习,最终到达目标轨道附近;最后通过仿真实验验证了所提TD3算法能够有效控制卫星到达目标轨道附近.

关键词

变轨控制/相对运动/目标轨道/深度强化学习

Key words

orbit change control/relative motion/target orbit/deep reinforcement learning

引用本文复制引用

出版年

2023

计算机时代

浙江省计算技术研究所　浙江省计算机学会

计算机时代

影响因子：0.411

ISSN：1006-8228

参考文献量3

段落导航