基于多智能体深度强化学习的分布式协同干扰功率分配算法OA北大核心
Allocation Algorithm of Distributed Cooperative Jamming Power Based on Multi-Agent Deep Reinforcement Learning
针对战场通信对抗协同干扰中的干扰功率分配难题,本文基于多智能体深度强化学习设计了一种分布式协同干扰功率分配算法.具体地,将通信干扰功率分配问题构建为完全协作的多智能体任务,采用集中式训练、分布式决策的方式缓解多智能体系统环境非平稳、决策维度高的问题,减少智能体之间的通信开销,并加入最大策略熵准则控制各智能体的探索效率,以最大化累积干扰奖励和最大化干扰策略熵为优化目标,加速各智能体间协同策略的学习.仿真结果表明,所提出的分布式算法能有效解决高维协同…查看全部>>
饶宁;许华;蒋磊;宋佰霖;史蕴豪
空军工程大学信息与导航学院,陕西西安710077空军工程大学信息与导航学院,陕西西安710077空军工程大学信息与导航学院,陕西西安710077空军工程大学信息与导航学院,陕西西安710077空军工程大学信息与导航学院,陕西西安710077
信息技术与安全科学
通信对抗协同功率分配多智能体深度强化学习分布式策略最大策略熵
《电子学报》 2022 (6)
1319-1330,12
评论