首页|期刊导航|控制理论与应用|Q学习算法中网格离散化方法的收敛性分析

Q学习算法中网格离散化方法的收敛性分析

蒋国飞高慧琪吴沧浦

控制理论与应用1999，Vol.16Issue(2)：194-198,5.

Convergence of Discretization Procedure in Q-Learning

蒋国飞 ¹高慧琪 ¹吴沧浦¹

作者信息

Q学习/动态规划/马尔可夫决策问题/连续状态和决策空间/离散化

数理科学

蒋国飞,高慧琪,吴沧浦..Q学习算法中网格离散化方法的收敛性分析[J].控制理论与应用,1999,16(2):194-198,5.

国家自然科学基金资助项目(69674005). （69674005）

OA北大核心CSCD

ISSN：1000-8152

访问量0

下载量0

段落导航