| 注册
首页|期刊导航|计算机应用研究|基于LSTM与非对称网络的改进DDPG算法研究

基于LSTM与非对称网络的改进DDPG算法研究

何富君 王晓争 刘凯

计算机应用研究2022,Vol.39Issue(1):183-187,5.
计算机应用研究2022,Vol.39Issue(1):183-187,5.DOI:10.19734/j.issn.1001-3695.2021.05.0200

基于LSTM与非对称网络的改进DDPG算法研究

Research on improved DDPG algorithm based on LSTM and asymmetric network

何富君 1王晓争 1刘凯1

作者信息

  • 1. 东北石油大学 机械科学与工程学院,黑龙江 大庆 163318
  • 折叠

摘要

关键词

深度确定性策略梯度/长短期记忆/非对称actor-critic/深度强化学习/动态环境

分类

信息技术与安全科学

引用本文复制引用

何富君,王晓争,刘凯..基于LSTM与非对称网络的改进DDPG算法研究[J].计算机应用研究,2022,39(1):183-187,5.

基金项目

国家重点研发计划资助项目(2018YFE0196000) (2018YFE0196000)

东北石油大学研究生创新科研资助项目(YJSCX2017-022NEPU) (YJSCX2017-022NEPU)

计算机应用研究

OA北大核心CSCDCSTPCD

1001-3695

访问量11
|
下载量0
段落导航相关论文