基于逆强化学习的航天器交会对接方法

扫码查看

原文链接

NETL
NSTL
万方数据
维普

中文摘要：针对使用神经网络解决追踪航天器接近静止目标问题,提出一种使用模型预测控制提供数据集,基于生成对抗逆强化学习训练神经网络的方法.首先在考虑追踪航天器最大速度约束,控制输入饱和约束和空间锥约束下,建立追踪航天器接近静止目标的动力学,并通过模型预测控制驱动航天器到达指定位置.其次为标称轨迹添加扰动,通过前述方法计算从各起始位置到目标点的轨迹,收集各轨迹各控制时刻的状态与控制信息,形成包含状态与对应控制的训练集.最后通过设置网络结构与参数和训练超参数,在训练集驱动下,采用生成对抗逆强化学习方法进行网络训练.仿真结果表明生成对抗逆强化学习可模仿专家轨迹行为,并成功训练神经网络,驱动航天器从起始点向目标位置运动.

外文标题：A spacecraft rendezvous and docking method based on inverse reinforcement learning

外文关键词：

model predictive controlgenerative adversarial inverse reinforcement learningimitation learningnetwork trainingneural network

作者：

岳承磊、汪雪川、岳晓奎、宋婷

展开 >

作者单位：

西北工业大学航天飞行动力学技术国家级重点实验室,西安 710072

西北工业大学航天学院,西安 710072

上海航天控制技术研究所,上海 201109

上海市空间智能控制技术重点实验室,上海 201109

展开 >

关键词：

模型预测控制生成对抗逆强化学习模仿学习网络训练神经网络

基金：

国家自然科学基金国家自然科学基金

项目编号：

U201320611972026

出版年：

2023

DOI：

10.7527/S1000-6893.2023.28420

航空学报

中国航空学会北京航空航天大学

航空学报

CSTPCDCSCD北大核心

影响因子：1.228

ISSN：1000-6893

年,卷(期)：2023.44(19)

参考文献量5