一种基于深度强化学习的动态自适应干扰功率分配方法OACSTPCD
A Dynamic Adaptive Jamming Power Allocation Method Based on Deep Reinforcement Learning
针对传统干扰功率分配方法在干扰目标策略未知的情况下容易造成资源浪费和干扰效费比低的问题,本文提出一种基于深度强化学习的动态自适应干扰功率分配方法.在目标通信功率及功率控制策略完全未知的情况下,该方法将空间分布的侦察节点的观测值作为连续状态输入,利用深度强化学习方法进行干扰功率的辅助决策,可通过对目标策略的有效学习实现自适应稳定干扰.为进一步提升算法性能,本文设计了基于时序误差的优先经验回放机制和自适应探索策略.仿真结果表明,所提方法在与传统干扰功率分配方法干扰效果相当的情况下可节约42.5%的功率资源,提升了干扰效费比,且成功率和功率损耗皆优于对比的智能算法.
彭翔;许华;蒋磊;张悦;饶宁
空军工程大学信息与导航学院,陕西西安 710077空军工程大学信息与导航学院,陕西西安 710077空军工程大学信息与导航学院,陕西西安 710077空军工程大学信息与导航学院,陕西西安 710077空军工程大学信息与导航学院,陕西西安 710077
电子信息工程
电子对抗通信对抗干扰资源分配干扰决策功率分配深度强化学习优先经验回放
electronic countermeasurescommunication countermeasuresjamming resource allocationjamming decision-makingpower allocationdeep reinforcement learningprioritized experience replay
《电子学报》 2023 (5)
分布式定制化轻量级深度神经网络中的关键方法研究
1223-1234,12
国家自然科学基金(No.61906156) National Natural Science Foundation of China(No.61906156)
评论