| 注册
首页|期刊导航|计算机应用研究|异策略模仿-强化学习序列推荐算法

异策略模仿-强化学习序列推荐算法

刘珈麟 贺泽宇 李俊

计算机应用研究2024,Vol.41Issue(5):P.1349-1355,7.
计算机应用研究2024,Vol.41Issue(5):P.1349-1355,7.DOI:10.19734/j.issn.1001-3695.2023.10.0447

异策略模仿-强化学习序列推荐算法

刘珈麟 1贺泽宇 2李俊3

作者信息

  • 1. 中国科学院计算机网络信息中心,北京100045 中国科学院大学,北京100045
  • 2. 北京信息科技大学计算机学院,北京100101
  • 3. 中国科学院计算机网络信息中心,北京100045
  • 折叠

摘要

关键词

异策略评估/模仿学习/逆强化学习/序列推荐

分类

信息技术与安全科学

引用本文复制引用

刘珈麟,贺泽宇,李俊..异策略模仿-强化学习序列推荐算法[J].计算机应用研究,2024,41(5):P.1349-1355,7.

基金项目

国家自然科学基金资助项目(61672490,61602436) (61672490,61602436)

中国科学院对外合作重点项目(241711KYSB20180002) (241711KYSB20180002)

国家重大研发计划子课题(2022YFC3320900)。 (2022YFC3320900)

计算机应用研究

OA北大核心CSTPCD

1001-3695

访问量0
|
下载量0
段落导航相关论文