控制理论与应用1999,Vol.16Issue(2):194-198,5.
Q学习算法中网格离散化方法的收敛性分析
Convergence of Discretization Procedure in Q-Learning
摘要
关键词
Q学习/动态规划/马尔可夫决策问题/连续状态和决策空间/离散化分类
数理科学引用本文复制引用
蒋国飞,高慧琪,吴沧浦..Q学习算法中网格离散化方法的收敛性分析[J].控制理论与应用,1999,16(2):194-198,5.基金项目
国家自然科学基金资助项目(69674005). (69674005)