| 注册
首页|期刊导航|计算机工程与应用|基于随机方差减小方法的DDPG算法

基于随机方差减小方法的DDPG算法

杨薛钰 陈建平 傅启明 陆悠 吴宏杰

计算机工程与应用2021,Vol.57Issue(19):104-111,8.
计算机工程与应用2021,Vol.57Issue(19):104-111,8.DOI:10.3778/j.issn.1002-8331.2009-0097

基于随机方差减小方法的DDPG算法

Deep Deterministic Policy Gradient Algorithm Based on Stochastic Variance Reduction Method

杨薛钰 1陈建平 2傅启明 3陆悠 4吴宏杰2

作者信息

  • 1. 苏州科技大学 电子与信息工程学院,江苏 苏州 215009
  • 2. 苏州科技大学 江苏省建筑智慧节能重点实验室,江苏 苏州 215009
  • 3. 苏州科技大学 苏州市移动网络技术与应用重点实验室,江苏 苏州 215009
  • 4. 珠海米枣智能科技有限公司,广东 珠海 519000
  • 折叠

摘要

关键词

深度强化学习/深度Q学习算法(DQN)/深度确定性策略梯度算法(DDPG)/随机方差缩减梯度技术

分类

信息技术与安全科学

引用本文复制引用

杨薛钰,陈建平,傅启明,陆悠,吴宏杰..基于随机方差减小方法的DDPG算法[J].计算机工程与应用,2021,57(19):104-111,8.

基金项目

国家自然科学基金(61876217,61876121,61772357,61750110519,61772355,61702055,61672371) (61876217,61876121,61772357,61750110519,61772355,61702055,61672371)

江苏省重点研发计划项目(BE2017663). (BE2017663)

计算机工程与应用

OA北大核心CSCDCSTPCD

1002-8331

访问量0
|
下载量0
段落导航相关论文