计算机工程与应用2021,Vol.57Issue(19):104-111,8.DOI:10.3778/j.issn.1002-8331.2009-0097
基于随机方差减小方法的DDPG算法
Deep Deterministic Policy Gradient Algorithm Based on Stochastic Variance Reduction Method
摘要
关键词
深度强化学习/深度Q学习算法(DQN)/深度确定性策略梯度算法(DDPG)/随机方差缩减梯度技术分类
信息技术与安全科学引用本文复制引用
杨薛钰,陈建平,傅启明,陆悠,吴宏杰..基于随机方差减小方法的DDPG算法[J].计算机工程与应用,2021,57(19):104-111,8.基金项目
国家自然科学基金(61876217,61876121,61772357,61750110519,61772355,61702055,61672371) (61876217,61876121,61772357,61750110519,61772355,61702055,61672371)
江苏省重点研发计划项目(BE2017663). (BE2017663)