| 注册
首页|期刊导航|南京邮电大学学报(自然科学版)|基于自适应不确定性度量的离线强化学习算法

基于自适应不确定性度量的离线强化学习算法

张伯雷 刘哲闰

南京邮电大学学报(自然科学版)2024,Vol.44Issue(4):P.98-104,7.
南京邮电大学学报(自然科学版)2024,Vol.44Issue(4):P.98-104,7.DOI:10.14132/j.cnki.1673-5439.2024.04.009

基于自适应不确定性度量的离线强化学习算法

张伯雷 1刘哲闰1

作者信息

  • 1. 南京邮电大学计算机学院,江苏南京210023
  • 折叠

摘要

关键词

离线强化学习/环境模型/自适应权重/不确定性度量

分类

信息技术与安全科学

引用本文复制引用

张伯雷,刘哲闰..基于自适应不确定性度量的离线强化学习算法[J].南京邮电大学学报(自然科学版),2024,44(4):P.98-104,7.

基金项目

国家自然科学基金(62202238)资助项目。 (62202238)

南京邮电大学学报(自然科学版)

OA北大核心CSTPCD

1673-5439

访问量0
|
下载量0
段落导航相关论文