首页|期刊导航|通信学报|基于深度强化学习的空天地一体化网络信息物理系统垂直切换策略

基于深度强化学习的空天地一体化网络信息物理系统垂直切换策略OA北大核心CSTPCD

Vertical handover policy for cyber-physical systems aided by SAGIN based on deep reinforcement learning

中文摘要英文摘要

针对空天地一体化网络信息物理系统模型复杂、很难获得网络拓扑先验知识和模型化假设的特点,研究其基于深度强化学习的垂直切换策略.首先,综合考虑系统稳定性、切换开销和网络使用成本约束,将垂直切换策略问题建模为约束马尔可夫决策过程(CMDP),并给出保证可行解存在的充分条件;其次,提出约束-近端策略优化(CPPO)算法解决该问题,并在基站侧引入分布式强化学习机制加速训练收敛.相较于基准策略,仿真验证了所提垂直切换策略的优越性和有效性.

The vertical handover policy of space-air-ground integrated cyber-physical systems based on deep reinforce-ment learning was studied,in which the challenges of complicated network model and difficulties in acquiring prior knowledge for network topology and model were addressed.By jointly taking the system stability,handover cost and network-using cost into account,the vertical handover policy problem was modeled as a constraint Markov decision pro-cess…查看全部>>

武艳;潘广川;姚明旿;杨清海;梁中明

西安电子科技大学空天地一体化综合业务网全国重点实验室,陕西 西安 710071西安电子科技大学空天地一体化综合业务网全国重点实验室,陕西 西安 710071西安电子科技大学空天地一体化综合业务网全国重点实验室,陕西 西安 710071西安电子科技大学空天地一体化综合业务网全国重点实验室,陕西 西安 710071深圳大学计算机与软件学院物联网研究中心,广东 深圳 518060

电子信息工程

空天地一体化网络信息物理系统深度强化学习垂直切换

space-air-ground integrated networkcyber-physical systemdeep reinforcement learningvertical handover

《通信学报》 2024 (8)

180-191,12

国家重点研发计划基金资助项目(No.2020YFB1807700)陕西省创新团队基金资助项目(No.2024RS-CXTD-01) The National Key Research and Development Program of China(No.2020YFB1807700),Innovation Capability Support Program of Shaanxi(No.2024RS-CXTD-01)

10.11959/j.issn.1000-436x.2024140

评论

您当前未登录!去登录点击加载更多...