首页|期刊导航|无线电通信技术|基于平均场内生奖励的多智能体强化学习算法

基于平均场内生奖励的多智能体强化学习算法

孙文绮李大鹏田峰丁良辉

无线电通信技术2023，Vol.49Issue(3)：556-565,10.

无线电通信技术2023，Vol.49Issue(3)：556-565,10.DOI:10.3969/j.issn.1003-3114.2023.03.022

Model-based Multi-agent Mean-field Intrinsic Reward Upper Confidence Reinforcement Learning Algorithm

孙文绮 ¹李大鹏 ¹田峰 ¹丁良辉²

作者信息

多智能体系统/平均场控制/基于模型的强化学习/内生奖励

信息技术与安全科学

孙文绮,李大鹏,田峰,丁良辉..基于平均场内生奖励的多智能体强化学习算法[J].无线电通信技术,2023,49(3):556-565,10.

国家重点研发计划(2021ZD0140405) （2021ZD0140405）

OA北大核心

ISSN：1003-3114

访问量0

下载量0

段落导航