| 注册
首页|期刊导航|计算机工程|强化学习中的时间差分法在用户学习方面的应用

强化学习中的时间差分法在用户学习方面的应用

陈俊杰 张必勇 宋瀚涛 陆玉昌 余雪丽

计算机工程2004,Vol.30Issue(4):40-41,124,3.
计算机工程2004,Vol.30Issue(4):40-41,124,3.

强化学习中的时间差分法在用户学习方面的应用

Application of TD(0) Method in Studying Users

陈俊杰 1张必勇 2宋瀚涛 2陆玉昌 1余雪丽3

作者信息

  • 1. 北京理工大学计算机系,北京,100081
  • 2. 太原理工大学计算机系,太原,030024
  • 3. 清华大学计算机系,北京,100084
  • 折叠

摘要

关键词

强化学习/时间差分法/用户Agent/用户模型/向量表示

分类

信息技术与安全科学

引用本文复制引用

陈俊杰,张必勇,宋瀚涛,陆玉昌,余雪丽..强化学习中的时间差分法在用户学习方面的应用[J].计算机工程,2004,30(4):40-41,124,3.

基金项目

国家重点基础研究规划"973"计划基金资助项目(G1998030414) (G1998030414)

山西省自然科学基金资助项目(20031038) (20031038)

教育部科学技术研究重点项目(03020) (03020)

计算机工程

OA北大核心CSCDCSTPCD

1000-3428

访问量0
|
下载量0
段落导航相关论文