窗口长度自适应调整的策略迭代最优控制OA北大核心CSTPCD
在系统模型参数未知的最优控制问题中,策略迭代能否快速收敛到最优控制策略的关键在于值函数的估计.为了提升值函数的估计精度以及收敛速度,本文提出一种窗口长度自适应调整的策略迭代最优控制算法.充分利用一段时间内的历史样本数据,通过影响力函数构建窗口长度与值函数估计性能之间的定量关系,根据数据窗口长度对估计性能影响力的不同,实现窗口长度的自适应调整.最后,将本文所提方法应用到连续发酵过程,结果表明,本文所提方法能够加快最优控制策略的收敛,克服参数变化或外部扰动对控制性能的影响,从而提升控制精度.
方欣;栾小丽;刘飞;
江南大学自动化研究所轻工过程先进控制教育部重点实验室,江苏无锡214122
数学
最优控制策略迭代窗口长度自适应调整影响力函数
《控制理论与应用》 2024 (004)
P.745-750 / 6
国家自然科学基金项目(61991402)资助.
评论