计算机应用研究2025,Vol.42Issue(4):P.1025-1033,9.DOI:10.19734/j.issn.1001-3695.2024.09.0340
基于行为克隆的机械臂多智能体深度强化学习轨迹跟踪控制
摘要
关键词
多智能体/孪生延迟深度确定性策略梯度/深度强化学习/轨迹跟踪/行为克隆分类
信息技术与安全科学引用本文复制引用
易佳豪,王福杰,胡锦涛,秦毅,郭芳,罗俊轩..基于行为克隆的机械臂多智能体深度强化学习轨迹跟踪控制[J].计算机应用研究,2025,42(4):P.1025-1033,9.基金项目
国家自然科学基金资助项目(62203116,62103106) (62203116,62103106)
广东省基础与应用基础研究面上项目(2024A1515010222) (2024A1515010222)
广东省教育厅特色创新项目(2022KTSCX138,2022ZDZX1031) (2022KTSCX138,2022ZDZX1031)
东莞市社会发展科技项目重点项目(20231800935882) (20231800935882)
松山湖科技特派员项目(20234430-01KCJ-G)。 (20234430-01KCJ-G)