首页|期刊导航|计算机工程与应用|Q-learning算法及其在囚徒困境问题中的实现

Q-learning算法及其在囚徒困境问题中的实现

张春阳陈小平刘贵全蔡庆生

计算机工程与应用2001，Vol.37Issue(13)：121-122，128,3.

Q-learning Algorithm and Its Usage in Prisoner's Dilemma

张春阳 ¹陈小平 ¹刘贵全 ¹蔡庆生¹

作者信息

机器学习　强化学习　Q-learning算法Agent囚徒困境问题　针锋相对算法

信息技术与安全科学

张春阳,陈小平,刘贵全,蔡庆生..Q-learning算法及其在囚徒困境问题中的实现[J].计算机工程与应用,2001,37(13):121-122，128,3.

OA北大核心CSCD

ISSN：1002-8331

访问量0

下载量0

段落导航