物联网技术2023,Vol.13Issue(7):69-75,7.DOI:10.16667/j.issn.2095-1302.2023.07.017
深度强化学习之近端策略优化研究
摘要
关键词
近端策略优化算法/深度学习/强化学习/深度强化学习/马尔可夫决策过程/策略梯度分类
信息技术与安全科学引用本文复制引用
金堃,邓向阳,于柯远..深度强化学习之近端策略优化研究[J].物联网技术,2023,13(7):69-75,7.基金项目
国家自然科学基金重大研究计划(91538201) (91538201)