计算机科学与探索2024,Vol.18Issue(4):P.1032-1046,15.DOI:10.3778/j.issn.1673-9418.2211106
潜在空间中的策略搜索强化学习方法
摘要
关键词
无模型强化学习/策略模型/状态表示/动作表示/连续动作空间/策略搜索强化学习方法分类
信息技术与安全科学引用本文复制引用
赵婷婷,王莹,孙威,陈亚瑞,王嫄,杨巨成..潜在空间中的策略搜索强化学习方法[J].计算机科学与探索,2024,18(4):P.1032-1046,15.基金项目
国家自然科学基金(61976156) (61976156)
天津市企业科技特派员项目(20YDTPJC00560)。 (20YDTPJC00560)