基于深度强化学习的OFDM自适应导频设计OACSTPCD
Adaptive pilot design for OFDM based on deep reinforcement learning
针对正交频分复用系统,提出了一种基于深度强化学习的自适应导频设计算法.将导频设计问题映射为马尔可夫决策过程,导频位置的索引定义为动作,用基于减少均方误差的策略定义奖励函数,使用深度强化学习来更新导频位置.根据信道条件自适应地动态分配导频,从而利用信道特性对抗信道衰落.仿真结果表明,所提算法在3GPP的3种典型多径信道下相较于传统导频均匀分配方案信道估计性能有显著的提升.
刘乔寿;周雄;刘爽;邓义锋
重庆邮电大学通信与信息工程学院,重庆 400065||先进网络与智能互联技术重庆市高校重点实验室,重庆 400065||泛在感知与互联重庆市重点实验室,重庆 400065重庆邮电大学通信与信息工程学院,重庆 400065||先进网络与智能互联技术重庆市高校重点实验室,重庆 400065||泛在感知与互联重庆市重点实验室,重庆 400065重庆邮电大学通信与信息工程学院,重庆 400065||先进网络与智能互联技术重庆市高校重点实验室,重庆 400065||泛在感知与互联重庆市重点实验室,重庆 400065重庆邮电大学通信与信息工程学院,重庆 400065||先进网络与智能互联技术重庆市高校重点实验室,重庆 400065||泛在感知与互联重庆市重点实验室,重庆 400065
电子信息工程
正交频分复用深度强化学习马尔可夫决策过程多径信道
OFDMdeep reinforcement learningMarkov decision processmultipath channel
《通信学报》 2023 (9)
基于大规模天线阵列的5G/WiFi网络多域共存关键技术研究
104-114,11
国家自然科学基金资助项目(No.61901075)重庆市教委科学技术基金资助项目(No.KJZDK202200604)The National Natural Science Foundation of China(No.61901075),The Science and Technology Research Pro-gram of Chongqing Municipal Education Commission(No.KJZDK202200604)
评论