首页|期刊导航|自动化学报|异策略深度强化学习中的经验回放研究综述

异策略深度强化学习中的经验回放研究综述

胡子剑高晓光万开方张乐天汪强龙 NERETIN Evgeny

自动化学报2023，Vol.49Issue(11)：2237-2256,20.

自动化学报2023，Vol.49Issue(11)：2237-2256,20.DOI:10.16383/j.aas.c220648

异策略深度强化学习中的经验回放研究综述

Research on Experience Replay of Off-policy Deep Reinforcement Learning:A Review

胡子剑 ¹高晓光 ¹万开方 ¹张乐天 ²汪强龙 ¹NERETIN Evgeny³

作者信息

1. 西北工业大学电子信息学院西安 710129 中国
2. 西安电子科技大学外国语学院西安 710126 中国
3. 莫斯科航空学院机器人与智能系统学院莫斯科 125993 俄罗斯
折叠

摘要

关键词

深度强化学习/异策略/经验回放/人工智能

Key words

Deep reinforcement learning(DRL)/off-policy/experience replay(ER)/artificial intelligence

引用本文复制引用

胡子剑,高晓光,万开方,张乐天,汪强龙,NERETIN Evgeny..异策略深度强化学习中的经验回放研究综述[J].自动化学报,2023,49(11):2237-2256,20.

基金项目

国家自然科学基金(62003267,61573285),中央高校基本科研业务费专项资金(G2022KY0602),电磁空间作战与应用重点实验室(2022ZX0090),西安市科技计划项目——关键核心技术攻关工程项目计划(21RGZN0016),陕西省重点研发计划项目(2023-GHZD-33)资助 Supported by National Natural Science Foundation of China(62003267,61573285),the Fundamental Research Funds for the Central Universities(G2022KY0602),the Technology on Electro-magnetic Space Operations and Applications Laboratory(2022ZX0090),the Key Core Technology Research Plan of Xi'an(21RGZN0016),and the Key Research and Development Pro-gram of Shaanxi Province(2023-GHZD-33) （62003267,61573285）

自动化学报

OA北大核心CSCDCSTPCD

ISSN：0254-4156

访问量4

下载量0

段落导航