基于多智能体深度强化学习的高速公路可变限速协同控制方法OA北大核心CSTPCD
Coordinated Variable Speed Limit Control for Freeway Based on Multi-Agent Deep Reinforcement Learning
面向高速公路多路段可变限速协同控制需求,针对高维参数空间高效训练寻优难题,提出了应用多智能体深度确定性策略梯度(MADDPG)算法的高速公路可变限速协同控制方法.区别于既有研究的单个智能体深度确定性策略梯度(DDPG)算法,MADDPG将每个管控单元抽象为具备Actor-Critic强化学习架构的智能体,在算法训练过程中共享各智能体的状态、动作信息,使得各智能体具备推测其余智能体控制策略的能力,进而实现多路段协同控制.基于开源仿真软件SUMO,在…查看全部>>
In order to meet the needs of coordinated variable speed limit(VSL)control of multi-segment on freeways,and to solve the problem of efficient training optimization in high-dimensional parameter space,a multi-agent deep deterministic policy gradient(MADDPG)algorithm is proposed for freeway VSL control.Different from the existing research on the single agent Deep Deterministic Policy Gradient(DDPG)algorithm,MADDPG abstracts each control unit as an agent with A…查看全部>>
余荣杰;徐灵;章锐辞
同济大学 道路与交通工程教育部重点实验室,上海 201804浙江杭绍甬高速公路有限公司,浙江 杭州 310000同济大学 道路与交通工程教育部重点实验室,上海 201804
交通运输
交通工程可变限速协同控制多智能体深度强化学习交通拥堵高速公路交通效率交通安全
traffic engineeringcoordinated variable speed limit controlmulti-agent deep reinforcement learningtraffic jamfreewaytraffic efficiencytraffic safety
《同济大学学报(自然科学版)》 2024 (7)
1089-1098,10
浙江省交通运输厅科技计划项目(2021047)
评论