| 注册
首页|期刊导航|工程科学学报|基于时间差分误差的离线强化学习采样策略

基于时间差分误差的离线强化学习采样策略

张龙飞 冯旸赫 梁星星 刘世旋 程光权 黄金才

工程科学学报2023,Vol.45Issue(12):P.2118-2128,11.
工程科学学报2023,Vol.45Issue(12):P.2118-2128,11.

基于时间差分误差的离线强化学习采样策略

张龙飞 1冯旸赫 1梁星星 1刘世旋 1程光权 1黄金才1

作者信息

  • 1. 国防科技大学系统工程学院,长沙410073
  • 折叠

摘要

关键词

离线/强化学习/采样策略/经验回放/时间差分误差

分类

矿业与冶金

引用本文复制引用

张龙飞,冯旸赫,梁星星,刘世旋,程光权,黄金才..基于时间差分误差的离线强化学习采样策略[J].工程科学学报,2023,45(12):P.2118-2128,11.

基金项目

国家自然科学基金面上资助项目(62273352)。 (62273352)

工程科学学报

OA北大核心CSCDCSTPCD

2095-9389

访问量0
|
下载量0
段落导航相关论文