计算机工程与应用2008,Vol.44Issue(28):29-31,48,4.
一种基于动态参数调整的强化学习动作选择机制
Action choice mechanism of reinforcement learning based on adjusted dynamic parameters
摘要
关键词
强化学习/Q学习/动作选择/ε-greedy机制分类
信息技术与安全科学引用本文复制引用
胡晓辉..一种基于动态参数调整的强化学习动作选择机制[J].计算机工程与应用,2008,44(28):29-31,48,4.基金项目
国家自然科学基金(the National Natural Science Foundation of China under Grant No.10661007) (the National Natural Science Foundation of China under Grant No.10661007)
兰州交通大学青蓝工程资助项目. ()