| 注册
首页|期刊导航|计算机工程与应用|Q-learning算法及其在囚徒困境问题中的实现

Q-learning算法及其在囚徒困境问题中的实现

张春阳 陈小平 刘贵全 蔡庆生

计算机工程与应用2001,Vol.37Issue(13):121-122,128,3.
计算机工程与应用2001,Vol.37Issue(13):121-122,128,3.

Q-learning算法及其在囚徒困境问题中的实现

Q-learning Algorithm and Its Usage in Prisoner's Dilemma

张春阳 1陈小平 1刘贵全 1蔡庆生1

作者信息

  • 1. 中国科学技术大学计算机系
  • 折叠

摘要

关键词

机器学习 强化学习 Q-learning算法Agent囚徒困境问题 针锋相对算法

分类

信息技术与安全科学

引用本文复制引用

张春阳,陈小平,刘贵全,蔡庆生..Q-learning算法及其在囚徒困境问题中的实现[J].计算机工程与应用,2001,37(13):121-122,128,3.

计算机工程与应用

OA北大核心CSCD

1002-8331

访问量0
|
下载量0
段落导航相关论文