现代防御技术2024,Vol.52Issue(2):P.63-71,9.DOI:10.3969/j.issn.1009-086x.2024.02.007
部分可观测条件下的策略迁移强化学习方法
摘要
关键词
多智能体/强化学习/部分观测/策略迁移/集中式训练与分散式执行分类
航空航天引用本文复制引用
王忠禹,徐晓鹏,王东..部分可观测条件下的策略迁移强化学习方法[J].现代防御技术,2024,52(2):P.63-71,9.基金项目
国家自然科学基金(61973050,62173061)。 (61973050,62173061)