| 注册
首页|期刊导航|自动化学报|采用分类经验回放的深度确定性策略梯度方法

采用分类经验回放的深度确定性策略梯度方法

时圣苗 刘全

自动化学报2022,Vol.48Issue(7):P.1816-1823,8.
自动化学报2022,Vol.48Issue(7):P.1816-1823,8.DOI:10.16383/j.aas.c190406

采用分类经验回放的深度确定性策略梯度方法

时圣苗 1刘全2

作者信息

  • 1. 苏州大学计算机科学与技术学院,苏州215006
  • 2. 苏州大学计算机科学与技术学院,苏州215006 苏州大学江苏省计算机信息处理技术重点实验室,苏州215006 吉林大学符号计算与知识工程教育部重点实验室,长春130012 软件新技术与产业化协同创新中心,南京210000
  • 折叠

摘要

关键词

连续控制任务/深度确定性策略梯度/经验回放/分类经验回放

分类

信息技术与安全科学

引用本文复制引用

时圣苗,刘全..采用分类经验回放的深度确定性策略梯度方法[J].自动化学报,2022,48(7):P.1816-1823,8.

基金项目

国家自然科学基金(61772355,61702055,61876217,62176175) (61772355,61702055,61876217,62176175)

江苏高校优势学科建设工程项目资助。 ()

自动化学报

OA北大核心CSCDCSTPCD

0254-4156

访问量0
|
下载量0
段落导航相关论文