首页|期刊导航|自动化学报|安全强化学习综述

安全强化学习综述

王雪松王荣荣程玉虎

自动化学报2023，Vol.49Issue(9)：1813-1835,23.

自动化学报2023，Vol.49Issue(9)：1813-1835,23.DOI:10.16383/j.aas.c220631

安全强化学习综述

Safe Reinforcement Learning:A Survey

王雪松 ¹王荣荣 ¹程玉虎¹

作者信息

1. 中国矿业大学信息与控制工程学院徐州 221116
折叠

摘要

关键词

安全强化学习/约束马尔科夫决策过程/学习过程/学习目标/离线强化学习

Key words

Safe reinforcement learning(SRL)/constrained Markov decision process(CMDP)/learning process/learning objective/offline reinforcement learning

引用本文复制引用

王雪松,王荣荣,程玉虎..安全强化学习综述[J].自动化学报,2023,49(9):1813-1835,23.

基金项目

国家自然科学基金(62176259,61976215),江苏省重点研发计划项目(BE2022095)资助Supported by National Natural Science Foundation of China(62176259,61976215)and Key Research and Development Pro-gram of Jiangsu Province(BE2022095) （62176259,61976215）

自动化学报

OA北大核心CSCDCSTPCD

ISSN：0254-4156

访问量0

下载量0

段落导航