天津科技大学学报2021,Vol.36Issue(1):68-74,7.DOI:10.13364/j.issn.1672-6510.20200044
一种基于条件生成对抗网络的模型化策略搜索方法
A Model-based Policy Search Method Based on Conditional Generative Adversarial Network
摘要
关键词
条件生成对抗网络/模型化强化学习/策略搜索/状态转移函数/环境模型分类
信息技术与安全科学引用本文复制引用
孔乐,赵婷婷..一种基于条件生成对抗网络的模型化策略搜索方法[J].天津科技大学学报,2021,36(1):68-74,7.基金项目
国家自然科学基金资助项目(61976156) (61976156)
天津市教委计划科研项目(2017KJ034) (2017KJ034)