| 注册
首页|期刊导航|计算机应用研究|用于连续时间中策略梯度算法的动作稳定更新算法

用于连续时间中策略梯度算法的动作稳定更新算法

宋江帆 李金龙

计算机应用研究2023,Vol.40Issue(10):P.2928-2932,2944,6.
计算机应用研究2023,Vol.40Issue(10):P.2928-2932,2944,6.DOI:10.19734/j.issn.1001-3695.2023.02.0092

用于连续时间中策略梯度算法的动作稳定更新算法

宋江帆 1李金龙1

作者信息

  • 1. 中国科学技术大学计算机科学与技术学院,合肥230000
  • 折叠

摘要

关键词

强化学习/连续时间/策略梯度/动作重复

分类

信息技术与安全科学

引用本文复制引用

宋江帆,李金龙..用于连续时间中策略梯度算法的动作稳定更新算法[J].计算机应用研究,2023,40(10):P.2928-2932,2944,6.

计算机应用研究

OA北大核心CSCDCSTPCD

1001-3695

访问量0
|
下载量0
段落导航相关论文