基于协同奖励函数多目标强化学习的智能频率控制策略研究

Intelligent frequency control strategy based on multi-objective reinforcement learning of cooperative reward function

韩保军 ¹高强 ²代飞 ¹杨宵 ¹吕颖 ²许忠义 ³付希越⁴

扫码查看

作者信息

1. 国网河南省电力公司,河南郑州 450052
2. 中国电力科学研究院有限公司,北京 100192
3. 国网浙江省电力有限公司松阳县供电公司,浙江松阳 323400
4. 武汉大学电气与自动化学院,湖北武汉 430072
折叠

摘要

在含大规模风电并网系统的智能频率控制策略中,仅考虑CPS控制准则易造成频率短期集中越限,严重影响智能自动发电控制(AGC)策略的控制效果.提出一种基于协同奖励函数的多目标强化学习(TOPQ-MORL)智能频率控制策略,该策略构建了计及多维度频率控制性能评价标准的协同奖励函数,实现了多维度频率控制性能标准在时间尺度上的配合评价.采用TOPQ学习策略对智能体动作空间进行全局寻优,有效解决了传统贪婪策略下的Q函数线性加权多目标强化学习算法运算效率不佳的问题.标准两区域互联电网AGC控制模型仿真研究结果表明:所提智能AGC控制策略能有效改善频率控制性能,显著提高系统在全时间尺度上的频率质量.

关键词

风电并网/智能频率控制策略/多维度频率控制性能标准/TOPQ-MORL算法/协同奖励函数

引用本文复制引用

基金项目

国家重点研发计划(2017YFB0902600)

出版年

2023

电力科学与技术学报

长沙理工大学

电力科学与技术学报

CSTPCDCSCD北大核心

影响因子：0.85

ISSN：1673-9140

参考文献量24

段落导航