自动化学报2025,Vol.51Issue(4):P.875-889,15.DOI:10.16383/j.aas.c240258
两团队零和博弈下熵引导的极小极大值分解强化学习方法
摘要
关键词
多智能体深度强化学习/两团队零和马尔科夫博弈/最大熵/值分解分类
信息技术与安全科学引用本文复制引用
胡光政,朱圆恒,赵冬斌..两团队零和博弈下熵引导的极小极大值分解强化学习方法[J].自动化学报,2025,51(4):P.875-889,15.基金项目
国家自然科学基金(62293541,62136008) (62293541,62136008)
北京市自然科学基金(4232056) (4232056)
北京市科技新星计划(20240484514) (20240484514)
中国科学院“全球共性挑战专项”(104GJHZ2022013GC)资助。 (104GJHZ2022013GC)