首页|期刊导航|空天防御|基于近端策略动态优化的多智能体编队方法

基于近端策略动态优化的多智能体编队方法OA

中文摘要

无人机集群系统具有能力冗余、抗毁能力强、适应复杂场景等优势,能够实现高效的任务执行和信息获取。近年来,深度强化学习技术被引入无人机集群编队控制方法中,以解决集群维度爆炸和集群系统建模困难的弊端,但深度强化学习面临训练效率低等问题。本文提出了一种基于改进近端策略优化方法的集群编队方法,通过引入动态估计法作为评价机制,解决了传统近端策略优化方法收敛速度慢和忽视高价值动作问题,有效提升了数据利用率。仿真试验证明,该方法能够提高训练效率,解决样本复用问题,具有良好的决策性能。

全家乐;马先龙;沈昱恒

西北工业大学航天学院,陕西西安710129西北工业大学航天学院,陕西西安710129上海机电工程研究所,上海201109

无人机集群深度强化学习近端策略优化逆强化学习集群决策

《空天防御》 2024 (2)

P.52-62,11

国家自然科学基金(61473226)。

评论

您当前未登录!去登录点击加载更多...