华中科技大学学报(自然科学版)2008,Vol.36Issue(z1):288-290,294,4.
基于回报函数逼近的学徒学习综述
Survey of apprenticeship learning based on reward function approximating
摘要
关键词
学徒学习/回报函数/综述/逆向增强学习/边际最大化分类
信息技术与安全科学引用本文复制引用
金卓军,钱徽,陈沈轶,朱淼良..基于回报函数逼近的学徒学习综述[J].华中科技大学学报(自然科学版),2008,36(z1):288-290,294,4.基金项目
浙江省科技厅重大项目(2006c13096). (2006c13096)