| 注册
首页|期刊导航|控制理论与应用|Q学习算法中网格离散化方法的收敛性分析

Q学习算法中网格离散化方法的收敛性分析

蒋国飞 高慧琪 吴沧浦

控制理论与应用1999,Vol.16Issue(2):194-198,5.
控制理论与应用1999,Vol.16Issue(2):194-198,5.

Q学习算法中网格离散化方法的收敛性分析

Convergence of Discretization Procedure in Q-Learning

蒋国飞 1高慧琪 1吴沧浦1

作者信息

  • 1. 北京理工大学自动控制系,北京,100081
  • 折叠

摘要

关键词

Q学习/动态规划/马尔可夫决策问题/连续状态和决策空间/离散化

分类

数理科学

引用本文复制引用

蒋国飞,高慧琪,吴沧浦..Q学习算法中网格离散化方法的收敛性分析[J].控制理论与应用,1999,16(2):194-198,5.

基金项目

国家自然科学基金资助项目(69674005). (69674005)

控制理论与应用

OA北大核心CSCD

1000-8152

访问量0
|
下载量0
段落导航相关论文