基于马氏决策过程模型的动态系统学习控制:研究前沿与展望OA北大核心CSCDCSTPCD
Learning Control of Dynamical Systems Based on Markov Decision Processes:Research Frontiers and Outlooks
基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programm…查看全部>>
Learning control of dynamical systems based on Markov decision processes (MDPs) is an interdisciplinary research area of machine learning, control theory, and operations research. The main objective in this research area is to realize data-driven multi-stage optimal control for complex or uncertain dynamical systems. This paper presents a comprehensive survey on the theory, algorithms, and applications of MDP-based learning control of dynamical systems. Emph…查看全部>>
徐昕;沈栋;高岩青;王凯
国防科学技术大学机电工程与自动化学院自动化研究所,长沙410073中国科学院自动化研究所, 北京100190复杂系统智能管理与控制国家重点实验室, 北京100190复杂系统智能管理与控制国家重点实验室,北京100190
学习控制Markov决策过程增强学习近似动态规划机器学习自适应控制
Learning control, Markov decision processes (MDP), reinforcement learning (RL), approximate dynamic programming (ADP), machine learning, adaptive control
《自动化学报》 2012 (5)
结构化增强学习及其在虚拟人运动规划中的应用
673-687,15
国家自然科学基金(61075072,90820302,60921061),霍英东青年教师基金优选资助课题(114005),教育部新世纪优秀人才支持计划(NCET-10-0901)资助
评论