自动化学报2019,Vol.45Issue(10):1870-1882,13.DOI:10.16383/j.aas.2018.c170635
深度Q学习的二次主动采样方法
Twice Sampling Method in Deep Q-network
摘要
关键词
优先经验回放/TD-error/深度Q网络/累积回报引用本文复制引用
赵英男,刘鹏,赵巍,唐降龙..深度Q学习的二次主动采样方法[J].自动化学报,2019,45(10):1870-1882,13.基金项目
国家自然科学基金(61671175, 61672190) 资助 (61671175, 61672190)