计算机工程2022,Vol.48Issue(5):P.74-81,8.DOI:10.19678/j.issn.1000-3428.0061437
一种基于多步竞争网络的多智能体协作方法
摘要
关键词
多智能体协作/深度强化学习/值分解/多步竞争网络/动作值函数分类
信息技术与安全科学引用本文复制引用
厉子凡,王浩,方宝富..一种基于多步竞争网络的多智能体协作方法[J].计算机工程,2022,48(5):P.74-81,8.基金项目
国家自然科学基金(61876206) (61876206)
中央高校基本科研业务费专项资金(ACAIM190102) (ACAIM190102)
安徽省自然科学基金(1708085MF146) (1708085MF146)
民航飞行技术与飞行安全重点实验室开放基金(FZ2020KF15)。 (FZ2020KF15)