| 注册
首页|期刊导航|计算机技术与发展|基于SARSA强化学习的审判人力资源调度方法

基于SARSA强化学习的审判人力资源调度方法

吴鹏 魏上清 董嘉鹏 潘理

计算机技术与发展2022,Vol.32Issue(9):82-88,7.
计算机技术与发展2022,Vol.32Issue(9):82-88,7.DOI:10.3969/j.issn.1673-629X.2022.09.013

基于SARSA强化学习的审判人力资源调度方法

Trial Human Resources Scheduling Method Based on SARSA Reinforcement Learning

吴鹏 1魏上清 2董嘉鹏 1潘理1

作者信息

  • 1. 上海交通大学 电子信息与电气工程学院,上海 200240
  • 2. 信息内容分析技术国家工程实验室,上海 200240
  • 折叠

摘要

关键词

强化学习/资源调度/决策优化/贪婪策略/马尔可夫决策过程

分类

信息技术与安全科学

引用本文复制引用

吴鹏,魏上清,董嘉鹏,潘理..基于SARSA强化学习的审判人力资源调度方法[J].计算机技术与发展,2022,32(9):82-88,7.

基金项目

国家自然科学基金(62002219) (62002219)

上海市扬帆计划项目(19YF1424700) (19YF1424700)

计算机技术与发展

OACSTPCD

1673-629X

访问量0
|
下载量0
段落导航相关论文