| 注册
首页|期刊导航|现代防御技术|部分可观测条件下的策略迁移强化学习方法

部分可观测条件下的策略迁移强化学习方法

王忠禹 徐晓鹏 王东

现代防御技术2024,Vol.52Issue(2):P.63-71,9.
现代防御技术2024,Vol.52Issue(2):P.63-71,9.DOI:10.3969/j.issn.1009-086x.2024.02.007

部分可观测条件下的策略迁移强化学习方法

王忠禹 1徐晓鹏 1王东1

作者信息

  • 1. 大连理工大学控制科学与工程学院,辽宁大连116024
  • 折叠

摘要

关键词

多智能体/强化学习/部分观测/策略迁移/集中式训练与分散式执行

分类

航空航天

引用本文复制引用

王忠禹,徐晓鹏,王东..部分可观测条件下的策略迁移强化学习方法[J].现代防御技术,2024,52(2):P.63-71,9.

基金项目

国家自然科学基金(61973050,62173061)。 (61973050,62173061)

现代防御技术

OA北大核心CSTPCD

1009-086X

访问量0
|
下载量0
段落导航相关论文