计算机应用研究2022,Vol.39Issue(1):183-187,5.DOI:10.19734/j.issn.1001-3695.2021.05.0200
基于LSTM与非对称网络的改进DDPG算法研究
Research on improved DDPG algorithm based on LSTM and asymmetric network
摘要
关键词
深度确定性策略梯度/长短期记忆/非对称actor-critic/深度强化学习/动态环境分类
信息技术与安全科学引用本文复制引用
何富君,王晓争,刘凯..基于LSTM与非对称网络的改进DDPG算法研究[J].计算机应用研究,2022,39(1):183-187,5.基金项目
国家重点研发计划资助项目(2018YFE0196000) (2018YFE0196000)
东北石油大学研究生创新科研资助项目(YJSCX2017-022NEPU) (YJSCX2017-022NEPU)