一种面向宽带跳频双动作的智能抗干扰决策算法OA北大核心CSTPCD
宽带跳频与深度强化学习结合的智能跳频通信模式能有效提高通信抗干扰能力。针对同时调整信号频点和功率的双动作空间智能决策由于频点离散但功率非离散使得决策依赖的深度强化学习算法难以设计的问题,基于离散型深度确定性策略梯度算法(Wolpertinger Deep Deterministic Policy Gradient,W-DDPG),提出了一种适于宽带跳频通信且具有发射频率和功率组成的双动作空间智能抗干扰决策方法。该决策方法面向频率/功率双动作空间,…查看全部>>
夏重阳;吴晓富;靳越
南京邮电大学通信与信息工程学院,南京210009南京邮电大学通信与信息工程学院,南京210009南京邮电大学通信与信息工程学院,南京210009
电子信息工程
通信抗干扰深度强化学习双动作空间智能决策
《电讯技术》 2024 (9)
P.1467-1473,7
国家自然科学基金资助项目(61771256)。
评论