| 注册
首页|期刊导航|自动化学报|深度Q学习的二次主动采样方法

深度Q学习的二次主动采样方法

赵英男 刘鹏 赵巍 唐降龙

自动化学报2019,Vol.45Issue(10):1870-1882,13.
自动化学报2019,Vol.45Issue(10):1870-1882,13.DOI:10.16383/j.aas.2018.c170635

深度Q学习的二次主动采样方法

Twice Sampling Method in Deep Q-network

赵英男 1刘鹏 1赵巍 1唐降龙1

作者信息

  • 1. 哈尔滨工业大学计算机科学与技术学院模式识别与智能系统研究中心 哈尔滨 150001
  • 折叠

摘要

关键词

优先经验回放/TD-error/深度Q网络/累积回报

引用本文复制引用

赵英男,刘鹏,赵巍,唐降龙..深度Q学习的二次主动采样方法[J].自动化学报,2019,45(10):1870-1882,13.

基金项目

国家自然科学基金(61671175, 61672190) 资助 (61671175, 61672190)

自动化学报

OA北大核心CSCDCSTPCD

0254-4156

访问量0
|
下载量0
段落导航相关论文