首页|期刊导航|计算机应用研究|用于连续时间中策略梯度算法的动作稳定更新算法

用于连续时间中策略梯度算法的动作稳定更新算法

宋江帆李金龙

计算机应用研究2023，Vol.40Issue(10)：P.2928-2932,2944,6.

计算机应用研究2023，Vol.40Issue(10)：P.2928-2932,2944,6.DOI:10.19734/j.issn.1001-3695.2023.02.0092

宋江帆 ¹李金龙¹

作者信息

强化学习/连续时间/策略梯度/动作重复

信息技术与安全科学

宋江帆,李金龙..用于连续时间中策略梯度算法的动作稳定更新算法[J].计算机应用研究,2023,40(10):P.2928-2932,2944,6.

OA北大核心CSCDCSTPCD

ISSN：1001-3695

访问量0

下载量0

段落导航