| 注册
首页|期刊导航|上海航天(中英文)|基于多智能体强化学习的轨道追逃博弈方法

基于多智能体强化学习的轨道追逃博弈方法

许旭升 党朝辉 宋斌 袁秋帆 肖余之

上海航天(中英文)2022,Vol.39Issue(2):24-31,8.
上海航天(中英文)2022,Vol.39Issue(2):24-31,8.DOI:10.19328/j.cnki.2096‑8655.2022.02.004

基于多智能体强化学习的轨道追逃博弈方法

Method for Cluster Satellite Orbit Pursuit-Evasion Game Based on Multi-agent Deep Deterministic Policy Gradient Algorithm

许旭升 1党朝辉 2宋斌 1袁秋帆 1肖余之1

作者信息

  • 1. 上海宇航系统工程研究所,上海201109
  • 2. 西北工业大学 航天学院,陕西 西安710109
  • 折叠

摘要

关键词

集群卫星/非合作目标/追逃博弈/奖励塑造/多智能体深度确定性策略梯度算法/涌现/智能

分类

航空航天

引用本文复制引用

许旭升,党朝辉,宋斌,袁秋帆,肖余之..基于多智能体强化学习的轨道追逃博弈方法[J].上海航天(中英文),2022,39(2):24-31,8.

上海航天(中英文)

OACSCDCSTPCD

2096-8655

访问量0
|
下载量0
段落导航相关论文