| 注册
首页|期刊导航|自动化学报|两团队零和博弈下熵引导的极小极大值分解强化学习方法

两团队零和博弈下熵引导的极小极大值分解强化学习方法

胡光政 朱圆恒 赵冬斌

自动化学报2025,Vol.51Issue(4):P.875-889,15.
自动化学报2025,Vol.51Issue(4):P.875-889,15.DOI:10.16383/j.aas.c240258

两团队零和博弈下熵引导的极小极大值分解强化学习方法

胡光政 1朱圆恒 1赵冬斌1

作者信息

  • 1. 中国科学院大学人工智能学院,北京100049 中国科学院自动化研究所多模态人工智能系统全国重点实验室,北京100190
  • 折叠

摘要

关键词

多智能体深度强化学习/两团队零和马尔科夫博弈/最大熵/值分解

分类

信息技术与安全科学

引用本文复制引用

胡光政,朱圆恒,赵冬斌..两团队零和博弈下熵引导的极小极大值分解强化学习方法[J].自动化学报,2025,51(4):P.875-889,15.

基金项目

国家自然科学基金(62293541,62136008) (62293541,62136008)

北京市自然科学基金(4232056) (4232056)

北京市科技新星计划(20240484514) (20240484514)

中国科学院“全球共性挑战专项”(104GJHZ2022013GC)资助。 (104GJHZ2022013GC)

自动化学报

OA北大核心

0254-4156

访问量0
|
下载量0
段落导航相关论文