计算机应用研究2023,Vol.40Issue(10):P.2928-2932,2944,6.DOI:10.19734/j.issn.1001-3695.2023.02.0092
用于连续时间中策略梯度算法的动作稳定更新算法
宋江帆 1李金龙1
作者信息
- 1. 中国科学技术大学计算机科学与技术学院,合肥230000
- 折叠
摘要
关键词
强化学习/连续时间/策略梯度/动作重复分类
信息技术与安全科学引用本文复制引用
宋江帆,李金龙..用于连续时间中策略梯度算法的动作稳定更新算法[J].计算机应用研究,2023,40(10):P.2928-2932,2944,6.