首页|期刊导航|计算机工程与应用|基于随机方差减小方法的DDPG算法

基于随机方差减小方法的DDPG算法

杨薛钰陈建平傅启明陆悠吴宏杰

计算机工程与应用2021，Vol.57Issue(19)：104-111,8.

计算机工程与应用2021，Vol.57Issue(19)：104-111,8.DOI:10.3778/j.issn.1002-8331.2009-0097

Deep Deterministic Policy Gradient Algorithm Based on Stochastic Variance Reduction Method

杨薛钰 ¹陈建平 ²傅启明 ³陆悠 ⁴吴宏杰²

作者信息

深度强化学习/深度Q学习算法(DQN)/深度确定性策略梯度算法(DDPG)/随机方差缩减梯度技术

信息技术与安全科学

杨薛钰,陈建平,傅启明,陆悠,吴宏杰..基于随机方差减小方法的DDPG算法[J].计算机工程与应用,2021,57(19):104-111,8.

国家自然科学基金(61876217,61876121,61772357,61750110519,61772355,61702055,61672371) （61876217,61876121,61772357,61750110519,61772355,61702055,61672371）

江苏省重点研发计划项目(BE2017663). （BE2017663）

OA北大核心CSCDCSTPCD

ISSN：1002-8331

访问量0

下载量0

段落导航