南京信息工程大学学报2021,Vol.13Issue(5):548-555,8.DOI:10.13878/j.cnki.jnuist.2021.05.006
基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制
Stochastic linear quadratic optimal tracking control for stochastic discrete time systems based on Q-learning
摘要
关键词
随机系统/Q学习算法/最优追踪控制/随机代数方程分类
数理科学引用本文复制引用
张正义,赵学艳..基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制[J].南京信息工程大学学报,2021,13(5):548-555,8.基金项目
国家自然科学基金(61873099,62073144) (61873099,62073144)
广东省自然科学基金(2020A1515010441) (2020A1515010441)
广州市科技计划(202002030158,202002030389) (202002030158,202002030389)