|
国家科技期刊平台
|
注册
中文
EN
首页
|
期刊导航
|
兵工自动化
|
降低方差的深度确定性策略梯度算法
降低方差的深度确定性策略梯度算法
赵国庆
徐君明
刘爱东
兵工自动化
2022,Vol.41
Issue(6):P.41-46,6.
下载
✕
兵工自动化
2022,Vol.41
Issue(6)
:P.41-46,6.
DOI:10.7690/bgzdh.2022.06.008
降低方差的深度确定性策略梯度算法
赵国庆
1
徐君明
1
刘爱东
1
作者信息
1.
海军航空大学岸防兵学院,山东烟台246001
折叠
摘要
关键词
强化学习
/
DDPG
/
平滑目标策略
/
策略延迟更新
/
降低方差
分类
军事科技
引用本文
复制引用
赵国庆,徐君明,刘爱东..降低方差的深度确定性策略梯度算法[J].兵工自动化,2022,41(6):P.41-46,6.
基金项目
2020海军军事理论研究课题。 ()
兵工自动化
OA
CSTPCD
ISSN:
1006-1576
下载
访问量
0
|
下载量
0
段落导航
相关论文
摘要
关键词
分类
引用文本
基金项目