考虑智能体前置状态及环境特征自适应机制的强化学习电网调度方法OA北大核心CSTPCD
高比例可再生能源的接入使得电网潮流难以预测与控制,给电网的安全稳定运行带来了新的挑战。相较于传统的调度控制模式,以强化学习为代表的智能调度方式能够应对部分可观测电网环境下的顺序决策问题,但在电网中可再生能源比例发生变化时易出现适应性较差的状况。针对该问题,以Actor-Critic为基础框架,采用前置状态表征智能体状态,并引入环境特征自适应机制,用于可再生能源比例变化场景的电网调度任务。由于调度动作后的电网状态受源荷波动等外源性随机事件影响,易引起状态空间爆炸问题,在潮流计算之前采用前置状态表征智能体状态,可有效缩减状态空间。引入环境特征的自适应机制可有效避免“决策遗忘”的问题,从而提高智能体对电网中可再生能源比例变化的适应性。仿真实验结果表明,在可再生能源比例动态变化的118节点电网调度任务中,该方法在收敛速度和控制稳定性等方面均表现优异。
杨艳红;卢鑫;张雷杰;周世威;裴玮;朱丹丹;
中国科学院电工研究所,北京100190中国石油大学(北京)人工智能学院,北京102249
动力与电气工程
强化学习A3C算法前置状态自适应机制电网调度
《高电压技术》 2024 (008)
P.3497-3507,I0012,I0013 / 13
国家自然科学基金(52277131,U2066211);中国科学院青年创新促进会(2021136)。
评论