基于ADP的状态约束互联非线性系统的分散镇定
Decentralized stabilization of state constrained interconnected nonlinear systems based on adaptive dynamic programming
赵博 1杜文千 1袁郭玲 1孔杰1
作者信息
- 1. 北京师范大学系统科学学院,100875,北京
- 折叠
摘要
针对一类含有常数型状态约束的互联非线性系统,提出一种基于自适应动态规划(adaptive dynamic programming,ADP)的分散镇定方法.引入边界函数对原系统进行坐标变换,将状态约束系统转化为无约束系统.对转化后的系统构造独立子系统和改进的代价函数,将鲁棒分散镇定问题转化为最优调节问题.构建局部评判神经网络并采用策略迭代算法求解哈密顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程,进而得到近似最优镇定律.通过李雅普诺夫稳定性理论证明了本文所提方法可使闭环互联系统和局部评判神经网络估计误差动态最终一致有界.数值仿真结果验证了所提出分散镇定方法的有效性.
关键词
自适应动态规划/强化学习/状态约束/互联非线性系统/分散镇定/最优控制Key words
adaptive dynamic programming/reinforcement learning/state constraints/interconnected nonlinear systems/decentralized stabilization/optimum control引用本文复制引用
基金项目
国家自然科学基金(61973330)
北京市自然科学基金(4212038)
出版年
2023