基于柔性行动器–评判器深度强化学习的电–气综合能源系统优化调度OA北大核心CSCDCSTPCD
Optimal Dispatch of Integrated Electricity-gas System With Soft Actor-critic Deep Reinforcement Learning
多能流协同优化调度是实现综合能源系统高效经济运行的核心技术之一.面向电–气综合能源系统运行优化问题,提出一种基于柔性行动器-评判器框架的深度强化学习方法,通过智能体与能源系统的交互,自适应学习控制策略.该方法可实现多能流系统的连续动作控制,且能够灵活处理风电、光伏、多能负荷等源荷不确定性问题,实现多场景下的电-气综合能源优化调度决策.首先,构建面向电-气综合能源系统调度的强化学习基本框架,介绍柔性行动器-评判器强化学习的基本原理;然后,构建与智能…查看全部>>
乔骥;王新迎;张擎;张东霞;蒲天骄
中国电力科学研究院有限公司,北京市海淀区 100192中国电力科学研究院有限公司,北京市海淀区 100192华北电力大学电气与电子工程学院,北京市昌平区 102206中国电力科学研究院有限公司,北京市海淀区 100192中国电力科学研究院有限公司,北京市海淀区 100192
信息技术与安全科学
电-气综合能源系统优化调度不确定性源荷深度强化学习柔性行动器-评判器
《中国电机工程学报》 2021 (3)
819-832,中插3,15
国家电网公司科技项目"数据驱动的能源互联网建模与仿真"(5700-201955468A-0-0-00).
评论