计算机工程2004,Vol.30Issue(4):40-41,124,3.
强化学习中的时间差分法在用户学习方面的应用
Application of TD(0) Method in Studying Users
摘要
关键词
强化学习/时间差分法/用户Agent/用户模型/向量表示分类
信息技术与安全科学引用本文复制引用
陈俊杰,张必勇,宋瀚涛,陆玉昌,余雪丽..强化学习中的时间差分法在用户学习方面的应用[J].计算机工程,2004,30(4):40-41,124,3.基金项目
国家重点基础研究规划"973"计划基金资助项目(G1998030414) (G1998030414)
山西省自然科学基金资助项目(20031038) (20031038)
教育部科学技术研究重点项目(03020) (03020)