首页|基于ADP的状态约束互联非线性系统的分散镇定

基于ADP的状态约束互联非线性系统的分散镇定

扫码查看
针对一类含有常数型状态约束的互联非线性系统,提出一种基于自适应动态规划(adaptive dynamic programming,ADP)的分散镇定方法.引入边界函数对原系统进行坐标变换,将状态约束系统转化为无约束系统.对转化后的系统构造独立子系统和改进的代价函数,将鲁棒分散镇定问题转化为最优调节问题.构建局部评判神经网络并采用策略迭代算法求解哈密顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程,进而得到近似最优镇定律.通过李雅普诺夫稳定性理论证明了本文所提方法可使闭环互联系统和局部评判神经网络估计误差动态最终一致有界.数值仿真结果验证了所提出分散镇定方法的有效性.
Decentralized stabilization of state constrained interconnected nonlinear systems based on adaptive dynamic programming

adaptive dynamic programmingreinforcement learningstate constraintsinterconnected nonlinear systemsdecentralized stabilizationoptimum control

赵博、杜文千、袁郭玲、孔杰

展开 >

北京师范大学系统科学学院,100875,北京

自适应动态规划 强化学习 状态约束 互联非线性系统 分散镇定 最优控制

国家自然科学基金北京市自然科学基金

619733304212038

2023

北京师范大学学报(自然科学版)
北京师范大学

北京师范大学学报(自然科学版)

CSTPCDCSCD北大核心
影响因子:0.505
ISSN:0476-0301
年,卷(期):2023.59(5)
  • 22