基于世界模型深度强化学习的含风电电力系统低碳经济调度OA北大核心CSTPCD
通过调度手段提高发电侧风电等可再生能源利用率,降低常规火电机组的碳排放是实现双碳目标的重要手段。针对含风电电力系统的低碳经济运行问题,提出一种基于世界模型深度强化学习的调度方法。首先,计及碳交易成本与发电成本构建了系统运行总成本最低的调度模型,采用基于世界模型的双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法求解系统各机组最优出力策略。该算法通过“因果Transformer”神经网络的自注意力机制和多层堆叠结构学习世界模型以等效真实环境,进一步结合TD3算法在世界模型决策空间中开展大规模探索,提高决策稳定性。以改进IEEE30节点系统为例,通过所提算法求解得到各机组发电策略,实现了含风电电力系统的低碳经济调度目标,表明该方法能有效提升风电消纳,减少系统碳排放量,降低运行成本。
陈实;朱亚斌;刘艺洪;罗欢;臧天磊;周步祥;
四川大学电气工程学院,四川省成都市610065
动力与电气工程
可再生能源世界模型深度强化学习低碳经济运行
《电网技术》 2024 (008)
P.3143-3154,I0021-I0024 / 16
国家自然科学基金项目(No.52377115,51907097);国家重点研发计划项目(No.2021YFB4000500)。
评论