| 注册
首页|期刊导航|兵工自动化|降低方差的深度确定性策略梯度算法

降低方差的深度确定性策略梯度算法

赵国庆 徐君明 刘爱东

兵工自动化2022,Vol.41Issue(6):P.41-46,6.
兵工自动化2022,Vol.41Issue(6):P.41-46,6.DOI:10.7690/bgzdh.2022.06.008

降低方差的深度确定性策略梯度算法

赵国庆 1徐君明 1刘爱东1

作者信息

  • 1. 海军航空大学岸防兵学院,山东烟台246001
  • 折叠

摘要

关键词

强化学习/DDPG/平滑目标策略/策略延迟更新/降低方差

分类

军事科技

引用本文复制引用

赵国庆,徐君明,刘爱东..降低方差的深度确定性策略梯度算法[J].兵工自动化,2022,41(6):P.41-46,6.

基金项目

2020海军军事理论研究课题。 ()

兵工自动化

OACSTPCD

1006-1576

访问量0
|
下载量0
段落导航相关论文