| 注册
首页|期刊导航|计算机应用研究|一种基于确定性环境模型的离线强化学习方法

一种基于确定性环境模型的离线强化学习方法

汤瑞航 黄初华 秦进

计算机应用研究2025,Vol.42Issue(5):P.1352-1355,4.
计算机应用研究2025,Vol.42Issue(5):P.1352-1355,4.DOI:10.19734/j.issn.1001-3695.2024.10.0357

一种基于确定性环境模型的离线强化学习方法

汤瑞航 1黄初华 1秦进1

作者信息

  • 1. 贵州大学计算机科学与技术学院公共大数据国家重点实验室,贵阳550025
  • 折叠

摘要

关键词

离线强化学习/基于模型的强化学习/不确定性度量

分类

计算机与自动化

引用本文复制引用

汤瑞航,黄初华,秦进..一种基于确定性环境模型的离线强化学习方法[J].计算机应用研究,2025,42(5):P.1352-1355,4.

基金项目

国家自然科学基金资助项目(62162007)。 (62162007)

计算机应用研究

OA北大核心

1001-3695

访问量0
|
下载量0
段落导航相关论文