首页|期刊导航|机器人|在线深度强化学习探索策略生成方法综述

在线深度强化学习探索策略生成方法综述

李石磊叶清袁志民陈云何涛付钰

机器人2024，Vol.46Issue(6)：P.753-768,16.

机器人2024，Vol.46Issue(6)：P.753-768,16.DOI:10.13973/j.cnki.robot.230252

李石磊 ¹叶清 ¹袁志民 ¹陈云 ¹何涛 ¹付钰¹

作者信息

在线深度强化学习/探索策略/任务策略/内在激励/参数空间/安全探索

信息技术与安全科学

李石磊,叶清,袁志民,陈云,何涛,付钰..在线深度强化学习探索策略生成方法综述[J].机器人,2024,46(6):P.753-768,16.

海军武器装备综合研究项目(2022108010) （2022108010）

军委科技委基础加强计划技术领域基金项目(2019-JCJQ-JJ-042)。（2019-JCJQ-JJ-042）

OA北大核心CSTPCD

ISSN：1002-0446

访问量3

下载量0

段落导航