智能空战深度强化决策方法现状与展望OA北大核心CSTPCD
本文聚焦于现代智能空战决策技术的发展需求,分析了智能空战场景的要素与特点,介绍了现有智能空战决策理论的研究现状,包括基于博弈理论的决策方法、先验数据驱动的决策方法、基于自主学习的决策方法,着重梳理了基于价值和基于策略的深度强化学习智能决策方法。最后,面向未来智能空战面临的各种挑战以及传统深度强化学习的局限性,展望了深度强化学习技术在空战领域的发展方向:面向集群作战的多体智能决策技术、面向广域时空的高效智能决策技术、面向复杂场景的泛化智能决策技术。
张烨;涂远刚;张良;崔颢;王靖宇;
西北工业大学航天学院,西安710072中国空空导弹研究院,河南洛阳471009
武器工业
空战决策人工智能强化学习智能博弈集群作战深度学习
《航空兵器》 2024 (003)
P.21-31 / 11
国家自然科学基金青年项目(52202502);中央高校基本科研业务费(D5000210857)。
评论