| 注册
首页|期刊导航|自动化学报|异策略深度强化学习中的经验回放研究综述

异策略深度强化学习中的经验回放研究综述

胡子剑 高晓光 万开方 张乐天 汪强龙 NERETIN Evgeny

自动化学报2023,Vol.49Issue(11):2237-2256,20.
自动化学报2023,Vol.49Issue(11):2237-2256,20.DOI:10.16383/j.aas.c220648

异策略深度强化学习中的经验回放研究综述

Research on Experience Replay of Off-policy Deep Reinforcement Learning:A Review

胡子剑 1高晓光 1万开方 1张乐天 2汪强龙 1NERETIN Evgeny3

作者信息

  • 1. 西北工业大学电子信息学院 西安 710129 中国
  • 2. 西安电子科技大学外国语学院 西安 710126 中国
  • 3. 莫斯科航空学院机器人与智能系统学院 莫斯科 125993 俄罗斯
  • 折叠

摘要

关键词

深度强化学习/异策略/经验回放/人工智能

Key words

Deep reinforcement learning(DRL)/off-policy/experience replay(ER)/artificial intelligence

引用本文复制引用

胡子剑,高晓光,万开方,张乐天,汪强龙,NERETIN Evgeny..异策略深度强化学习中的经验回放研究综述[J].自动化学报,2023,49(11):2237-2256,20.

基金项目

国家自然科学基金(62003267,61573285),中央高校基本科研业务费专项资金(G2022KY0602),电磁空间作战与应用重点实验室(2022ZX0090),西安市科技计划项目——关键核心技术攻关工程项目计划(21RGZN0016),陕西省重点研发计划项目(2023-GHZD-33)资助 Supported by National Natural Science Foundation of China(62003267,61573285),the Fundamental Research Funds for the Central Universities(G2022KY0602),the Technology on Electro-magnetic Space Operations and Applications Laboratory(2022ZX0090),the Key Core Technology Research Plan of Xi'an(21RGZN0016),and the Key Research and Development Pro-gram of Shaanxi Province(2023-GHZD-33) (62003267,61573285)

自动化学报

OA北大核心CSCDCSTPCD

0254-4156

访问量0
|
下载量0
段落导航相关论文