| 注册
首页|期刊导航|计算机工程与应用|基于内在奖励的强化学习推荐探索策略

基于内在奖励的强化学习推荐探索策略

庾源清 马为之 张敏

计算机工程与应用2025,Vol.61Issue(7):P.188-195,8.
计算机工程与应用2025,Vol.61Issue(7):P.188-195,8.DOI:10.3778/j.issn.1002-8331.2311-0037

基于内在奖励的强化学习推荐探索策略

庾源清 1马为之 2张敏1

作者信息

  • 1. 清华大学计算机科学与技术系,北京100084
  • 2. 清华大学智能产业研究院,北京100084
  • 折叠

摘要

关键词

推荐系统/强化学习/探索策略

分类

信息技术与安全科学

引用本文复制引用

庾源清,马为之,张敏..基于内在奖励的强化学习推荐探索策略[J].计算机工程与应用,2025,61(7):P.188-195,8.

基金项目

国家自然科学基金(U21B2026,62002191) (U21B2026,62002191)

泉城实验室(QCLZD202301)。 (QCLZD202301)

计算机工程与应用

OA北大核心

1002-8331

访问量4
|
下载量0
段落导航相关论文