计算机应用研究2025,Vol.42Issue(5):P.1352-1355,4.DOI:10.19734/j.issn.1001-3695.2024.10.0357
一种基于确定性环境模型的离线强化学习方法
摘要
关键词
离线强化学习/基于模型的强化学习/不确定性度量分类
计算机与自动化引用本文复制引用
汤瑞航,黄初华,秦进..一种基于确定性环境模型的离线强化学习方法[J].计算机应用研究,2025,42(5):P.1352-1355,4.基金项目
国家自然科学基金资助项目(62162007)。 (62162007)