基于回报函数逼近的学徒学习综述

金卓军钱徽陈沈轶朱淼良

华中科技大学学报（自然科学版）2008，Vol.36Issue(z1)：288-290,294,4.

Survey of apprenticeship learning based on reward function approximating

金卓军 ¹钱徽 ¹陈沈轶 ¹朱淼良¹

作者信息

学徒学习/回报函数/综述/逆向增强学习/边际最大化

信息技术与安全科学

金卓军,钱徽,陈沈轶,朱淼良..基于回报函数逼近的学徒学习综述[J].华中科技大学学报（自然科学版）,2008,36(z1):288-290,294,4.

浙江省科技厅重大项目(2006c13096). （2006c13096）

OA北大核心CSCDCSTPCD

ISSN：1671-4512

访问量0

下载量0

段落导航