上海航天(中英文)2022,Vol.39Issue(2):24-31,8.DOI:10.19328/j.cnki.2096‑8655.2022.02.004
基于多智能体强化学习的轨道追逃博弈方法
Method for Cluster Satellite Orbit Pursuit-Evasion Game Based on Multi-agent Deep Deterministic Policy Gradient Algorithm
许旭升 1党朝辉 2宋斌 1袁秋帆 1肖余之1
作者信息
- 1. 上海宇航系统工程研究所,上海201109
- 2. 西北工业大学 航天学院,陕西 西安710109
- 折叠
摘要
关键词
集群卫星/非合作目标/追逃博弈/奖励塑造/多智能体深度确定性策略梯度算法/涌现/智能分类
航空航天引用本文复制引用
许旭升,党朝辉,宋斌,袁秋帆,肖余之..基于多智能体强化学习的轨道追逃博弈方法[J].上海航天(中英文),2022,39(2):24-31,8.