计算机技术与发展2022,Vol.32Issue(9):82-88,7.DOI:10.3969/j.issn.1673-629X.2022.09.013
基于SARSA强化学习的审判人力资源调度方法
Trial Human Resources Scheduling Method Based on SARSA Reinforcement Learning
摘要
关键词
强化学习/资源调度/决策优化/贪婪策略/马尔可夫决策过程分类
信息技术与安全科学引用本文复制引用
吴鹏,魏上清,董嘉鹏,潘理..基于SARSA强化学习的审判人力资源调度方法[J].计算机技术与发展,2022,32(9):82-88,7.基金项目
国家自然科学基金(62002219) (62002219)
上海市扬帆计划项目(19YF1424700) (19YF1424700)