异构网络中基于强化学习的通信-计算资源联合分配算法OA北大核心CSTPCD
基于强化学习(Reinforcement Learning,RL),在保证用户服务质量(Quality of Service,QoS)的前提下,研究了人机物混合接入的异构网络中通信-计算资源联合分配算法。建立了一种新型人机物混合接入的异构网络拓扑结构。在最小服务质量需求、无人机(Unmanned Aerial Vehicle,UAV)传输功率等限制条件下,将信道分配、功率分配和计算资源联合分配问题建模为最小化系统时延和能耗的多目标优化问题。基于强化学习理论和多智能体马尔可夫决策过程,提出一种分布式Q学习通信-计算资源联合分配(Distributed Q-learning Communication and Computing joint Resources Allocation,DQ-CCRA)算法。该算法与现有算法相比,不仅能够降低人类型设备对物类型设备的干扰,还能有效减小系统时延和能耗,将系统总开销降低7.4%。
李丽妍;李学华;陈硕;孙立新;
北京信息科技大学现代测控技术教育部重点实验室,北京102206北京信息科技大学佰才邦技术智慧物联联合实验室,北京102206
电子信息工程
异构网络人机物混合接入资源分配分布式Q学习多无人机通信
《电讯技术》 2024 (008)
P.1266-1274 / 9
国家自然科学基金资助项目(61901043);北京市教育委员会科学研究计划项目(KM202211232010);北京信息科技大学勤信人才培养计划(QXTCPB202101)。
评论