首页|期刊导航|自动化学报|两团队零和博弈下熵引导的极小极大值分解强化学习方法

两团队零和博弈下熵引导的极小极大值分解强化学习方法

胡光政朱圆恒赵冬斌

自动化学报2025，Vol.51Issue(4)：P.875-889,15.

自动化学报2025，Vol.51Issue(4)：P.875-889,15.DOI:10.16383/j.aas.c240258

胡光政 ¹朱圆恒 ¹赵冬斌¹

作者信息

多智能体深度强化学习/两团队零和马尔科夫博弈/最大熵/值分解

信息技术与安全科学

胡光政,朱圆恒,赵冬斌..两团队零和博弈下熵引导的极小极大值分解强化学习方法[J].自动化学报,2025,51(4):P.875-889,15.

国家自然科学基金(62293541,62136008) （62293541,62136008）

北京市自然科学基金(4232056) （4232056）

北京市科技新星计划(20240484514) （20240484514）

中国科学院“全球共性挑战专项”(104GJHZ2022013GC)资助。（104GJHZ2022013GC）

OA北大核心

ISSN：0254-4156

访问量15

下载量0

段落导航