摘要
2020年,我国在世界气候变化大会上做出了“碳中和、碳达峰”的承诺,预示着作为化石能源发电替代方式的新能源发电将迎来新的发展热潮。然而新能源所固有的波动性、间歇性与随机性增加了新能源出力的预测难度,客观存在的新能源预测偏差使电网的调度运行面临更加严峻的挑战。如何安排适应新能源预测偏差不确定性的调度方案是调度部门亟待解决的问题。近年来,以深度学习、强化学习等为代表的新兴机器学习技术不断涌现,为电力系统实际工程问题的解决提供了新方法和新思路。本文将机器学习技术应用于电力系统动态经济调度场景,具体工作安排如下: 本文基于深度强化学习算法,构建了应对电力系统不确定因素的动态经济调度模型。本文首先将调度决策中心视为智能体,将电力系统视为环境,将动态经济调度转化为多阶段决策模型。针对模型中状态与动作空间连续的特点,本文结合前沿算法近端策略优化法与深度神经网络求解该决策问题。最后在算例分析中验证了所提方法的可行性与适用性。算例表明,深度强化学习模型可基于其探索-交互-反馈-学习的机制,自适应电力系统环境中的不确定性,避免对复杂随机变量构建概率模型,且该方法不受限于系统规模,缩短了在线决策时间。 强化学习模型中复杂的奖励函数增加了建模难度,训练初期无先验知识引导使得算法收敛时间较长。针对上述不足,本文提出了基于生成对抗模仿学习的动态经济调度模型。首先,本文引入模仿学习,将完美调度生成的最优调度策略作为引导智能体探索的专家策略,改善算法的收敛性问题。其次,本文利用生成对抗网络博弈对抗的特点,构建生成器生成调度策略,构建判别器识别生成策略与完美调度策略,避免人为定义动态经济调度奖励函数。最后,利用算例分析验证了该模型相较于单一强化学习模型的优越性。该模型可实现端到端的调度策略学习,避免了无先验知识时智能体的无意义动作探索,缩短离线训练时间,增强了算法应对高维复杂问题时的能力。 本文创新性的将电力系统动态经济调度视作决策模型,并利用数据驱动的机器学习算法充分挖掘数据中包含的不确定性信息,突破了基于模型算法的瓶颈,取得了良好的计算效果。在人工智能技术应用场景的不断增多的未来,应用机器学习算法进行动态经济调度将取得更大突破。