基于ADP的状态约束互联非线性系统的分散镇定

Decentralized stabilization of state constrained interconnected nonlinear systems based on adaptive dynamic programming

赵博 ¹杜文千 ¹袁郭玲 ¹孔杰¹

扫码查看

作者信息

1. 北京师范大学系统科学学院,100875,北京
折叠

摘要

针对一类含有常数型状态约束的互联非线性系统,提出一种基于自适应动态规划(adaptive dynamic programming,ADP)的分散镇定方法.引入边界函数对原系统进行坐标变换,将状态约束系统转化为无约束系统.对转化后的系统构造独立子系统和改进的代价函数,将鲁棒分散镇定问题转化为最优调节问题.构建局部评判神经网络并采用策略迭代算法求解哈密顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程,进而得到近似最优镇定律.通过李雅普诺夫稳定性理论证明了本文所提方法可使闭环互联系统和局部评判神经网络估计误差动态最终一致有界.数值仿真结果验证了所提出分散镇定方法的有效性.

关键词

自适应动态规划/强化学习/状态约束/互联非线性系统/分散镇定/最优控制

Key words

adaptive dynamic programming/reinforcement learning/state constraints/interconnected nonlinear systems/decentralized stabilization/optimum control

引用本文复制引用

基金项目

国家自然科学基金(61973330)

北京市自然科学基金(4212038)

出版年

2023

北京师范大学学报(自然科学版)

北京师范大学

北京师范大学学报(自然科学版)

CSTPCDCSCD北大核心

影响因子：0.505

ISSN：0476-0301

参考文献量22

段落导航