基于强化学习的多园区综合能源系统经济调度OA北大核心CSTPCD
多园区综合能源系统中新能源出力与负荷的波动性以及多种能量之间的耦合关系,给多园区综合能源系统的优化调度带来诸多挑战。为此提出一种基于数据驱动的多智能体近端策略优化(multi-agent proximal policy optimization,MAPPO)多园区综合能源系统经济调度方法。文章综合考虑园区间的能量交易与碳市场交易,以园区日运行成本最小为目标,建立多园区综合能源系统实时优化调度模型;将该优化问题建模为马尔科夫决策过程,并设计状态空间、动作空间以及奖励函数,通过大量历史数据的训练得到多园区综合能源系统优化调度神经网络模型,实现多园区分散式实时优化调度。仿真结果表明:在新能源出力与负荷随机性波动影响下,所提方法能够在降低各园区运行成本的同时减少园区间的信息交互,有助于提高各园区隐私信息的安全性。
王丙文;付明;黄堃;
南瑞集团有限公司(国网电力科学研究院),南京210000
动力与电气工程
多园区综合能源系统实时经济调度强化学习多智能体近端策略优化
《电测与仪表》 2024 (009)
P.32-39 / 8
国家重点研发计划项目(2018YFB0905000)。
评论