南京邮电大学学报(自然科学版)2024,Vol.44Issue(4):P.98-104,7.DOI:10.14132/j.cnki.1673-5439.2024.04.009
基于自适应不确定性度量的离线强化学习算法
摘要
关键词
离线强化学习/环境模型/自适应权重/不确定性度量分类
信息技术与安全科学引用本文复制引用
张伯雷,刘哲闰..基于自适应不确定性度量的离线强化学习算法[J].南京邮电大学学报(自然科学版),2024,44(4):P.98-104,7.基金项目
国家自然科学基金(62202238)资助项目。 (62202238)