| 注册
首页|期刊导航|自动化学报|基于优先采样模型的离线强化学习

基于优先采样模型的离线强化学习

顾扬 程玉虎 王雪松

自动化学报2024,Vol.50Issue(1):P.143-153,11.
自动化学报2024,Vol.50Issue(1):P.143-153,11.DOI:10.16383/j.aas.c230019

基于优先采样模型的离线强化学习

顾扬 1程玉虎 1王雪松1

作者信息

  • 1. 中国矿业大学信息与控制工程学院,徐州221116
  • 折叠

摘要

关键词

离线强化学习/优先采样模型/时序差分误差//批约束深度Q学习

分类

信息技术与安全科学

引用本文复制引用

顾扬,程玉虎,王雪松..基于优先采样模型的离线强化学习[J].自动化学报,2024,50(1):P.143-153,11.

基金项目

国家自然科学基金(62176259,62373364) (62176259,62373364)

江苏省重点研发计划项目(BE2022095)资助。 (BE2022095)

自动化学报

OA北大核心CSTPCD

0254-4156

访问量0
|
下载量0
段落导航相关论文