计算机应用研究2023,Vol.40Issue(6):1692-1696,1701,6.DOI:10.19734/j.issn.1001-3695.2022.08.0549
安全约束下合作型多智能体TD3算法
Cooperative multi-agent TD3 algorithm under security constraints
摘要
关键词
安全强化学习/多智能体/拉格朗日乘子法分类
信息技术与安全科学引用本文复制引用
郝禹哲,王振雷..安全约束下合作型多智能体TD3算法[J].计算机应用研究,2023,40(6):1692-1696,1701,6.基金项目
国家自然科学基金重大项目课题(62293502,62173147) (62293502,62173147)
中央高校基本科研业务费专项资金资助项目(222202317006) (222202317006)
高等学校学科创新引智计划资助项目(B17017) (B17017)
上海人工智能实验室资助项目 ()