| 注册
首页|期刊导航|无线电通信技术|基于平均场内生奖励的多智能体强化学习算法

基于平均场内生奖励的多智能体强化学习算法

孙文绮 李大鹏 田峰 丁良辉

无线电通信技术2023,Vol.49Issue(3):556-565,10.
无线电通信技术2023,Vol.49Issue(3):556-565,10.DOI:10.3969/j.issn.1003-3114.2023.03.022

基于平均场内生奖励的多智能体强化学习算法

Model-based Multi-agent Mean-field Intrinsic Reward Upper Confidence Reinforcement Learning Algorithm

孙文绮 1李大鹏 1田峰 1丁良辉2

作者信息

  • 1. 南京邮电大学 通信与信息工程学院,江苏 南京 210003
  • 2. 上海交通大学 电子工程系,上海 200240
  • 折叠

摘要

关键词

多智能体系统/平均场控制/基于模型的强化学习/内生奖励

分类

信息技术与安全科学

引用本文复制引用

孙文绮,李大鹏,田峰,丁良辉..基于平均场内生奖励的多智能体强化学习算法[J].无线电通信技术,2023,49(3):556-565,10.

基金项目

国家重点研发计划(2021ZD0140405) (2021ZD0140405)

无线电通信技术

OA北大核心

1003-3114

访问量0
|
下载量0
段落导航相关论文