无线电通信技术2023,Vol.49Issue(3):556-565,10.DOI:10.3969/j.issn.1003-3114.2023.03.022
基于平均场内生奖励的多智能体强化学习算法
Model-based Multi-agent Mean-field Intrinsic Reward Upper Confidence Reinforcement Learning Algorithm
摘要
关键词
多智能体系统/平均场控制/基于模型的强化学习/内生奖励分类
信息技术与安全科学引用本文复制引用
孙文绮,李大鹏,田峰,丁良辉..基于平均场内生奖励的多智能体强化学习算法[J].无线电通信技术,2023,49(3):556-565,10.基金项目
国家重点研发计划(2021ZD0140405) (2021ZD0140405)