首页|期刊导航|指挥控制与仿真|基于深度强化学习潜艇攻防对抗训练指挥决策研究

基于深度强化学习潜艇攻防对抗训练指挥决策研究OACSTPCD

Research on Command Decision-making of Submarine Attack and Defense Confrontation Training Based on Deep Reinforcement Learning

中文摘要

潜艇和水面舰艇编队间的攻防对抗是潜艇作战研究的重点内容,如何确保潜艇在舰艇编队、反潜直升机等兵力的联合封锁下存活和突围,是对潜艇指挥决策的考验.为此,针对潜舰机博弈对抗场景,从深度强化学习和规则推理两个方面构建潜艇智能体,提出两种近端策略优化(Proximal Policy Optimization,PPO)算法改进机制,开展互博弈对抗和分布式训练,最终实现潜艇在对抗过程中的智能决策,相关技术路线和算法在兵棋对战平台上得到实施和验证,算法改进后的…查看全部>>

郭洪宇;初阳;刘志;周玉芳

江苏自动化研究所,江苏 连云港 222061江苏自动化研究所,江苏 连云港 222061江苏自动化研究所,江苏 连云港 222061江苏自动化研究所,江苏 连云港 222061

军事科技

智能指挥决策深度强化学习近端策略优化算法互博弈

《指挥控制与仿真》 2022 (1)

103-111,9

10.3969/j.issn.1673-3819.2022.01.015

评论

您当前未登录!去登录点击加载更多...