机器人2024,Vol.46Issue(6):P.753-768,16.DOI:10.13973/j.cnki.robot.230252
在线深度强化学习探索策略生成方法综述
摘要
关键词
在线深度强化学习/探索策略/任务策略/内在激励/参数空间/安全探索分类
信息技术与安全科学引用本文复制引用
李石磊,叶清,袁志民,陈云,何涛,付钰..在线深度强化学习探索策略生成方法综述[J].机器人,2024,46(6):P.753-768,16.基金项目
海军武器装备综合研究项目(2022108010) (2022108010)
军委科技委基础加强计划技术领域基金项目(2019-JCJQ-JJ-042)。 (2019-JCJQ-JJ-042)