首页|期刊导航|自动化学报|采用分类经验回放的深度确定性策略梯度方法

采用分类经验回放的深度确定性策略梯度方法

时圣苗刘全

自动化学报2022，Vol.48Issue(7)：P.1816-1823,8.

自动化学报2022，Vol.48Issue(7)：P.1816-1823,8.DOI:10.16383/j.aas.c190406

时圣苗 ¹刘全²

作者信息

1. 苏州大学计算机科学与技术学院,苏州215006
2. 苏州大学计算机科学与技术学院,苏州215006 苏州大学江苏省计算机信息处理技术重点实验室,苏州215006 吉林大学符号计算与知识工程教育部重点实验室,长春130012 软件新技术与产业化协同创新中心,南京210000
折叠

连续控制任务/深度确定性策略梯度/经验回放/分类经验回放

信息技术与安全科学

时圣苗,刘全..采用分类经验回放的深度确定性策略梯度方法[J].自动化学报,2022,48(7):P.1816-1823,8.

国家自然科学基金(61772355,61702055,61876217,62176175) （61772355,61702055,61876217,62176175）

江苏高校优势学科建设工程项目资助。（）

OA北大核心CSCDCSTPCD

ISSN：0254-4156

访问量0

下载量0

段落导航