计算机工程与应用2001,Vol.37Issue(13):121-122,128,3.
Q-learning算法及其在囚徒困境问题中的实现
Q-learning Algorithm and Its Usage in Prisoner's Dilemma
摘要
关键词
机器学习 强化学习 Q-learning算法Agent囚徒困境问题 针锋相对算法分类
信息技术与安全科学引用本文复制引用
张春阳,陈小平,刘贵全,蔡庆生..Q-learning算法及其在囚徒困境问题中的实现[J].计算机工程与应用,2001,37(13):121-122,128,3.