首页|期刊导航|计算机工程与应用|一种基于动态参数调整的强化学习动作选择机制

一种基于动态参数调整的强化学习动作选择机制

胡晓辉

计算机工程与应用2008，Vol.44Issue(28)：29-31,48,4.

一种基于动态参数调整的强化学习动作选择机制

Action choice mechanism of reinforcement learning based on adjusted dynamic parameters

胡晓辉¹

作者信息

1. 兰州交通大学,电子与信息工程学院,兰州,730070
折叠

摘要

关键词

强化学习/Q学习/动作选择/ε-greedy机制

分类

信息技术与安全科学

引用本文复制引用

胡晓辉..一种基于动态参数调整的强化学习动作选择机制[J].计算机工程与应用,2008,44(28):29-31,48,4.

基金项目

国家自然科学基金(the National Natural Science Foundation of China under Grant No.10661007) （the National Natural Science Foundation of China under Grant No.10661007）

兰州交通大学青蓝工程资助项目. （）

计算机工程与应用

OA北大核心CSCDCSTPCD

ISSN：1002-8331

访问量0

下载量0

段落导航