计算机应用研究2024,Vol.41Issue(8):P.2434-2440,7.DOI:10.19734/j.issn.1001-3695.2023.11.0580
基于二阶价值梯度模型强化学习的工业过程控制方法
摘要
关键词
工业过程控制/模型强化学习/二阶价值梯度/状态价值函数/状态采样策略分类
信息技术与安全科学引用本文复制引用
张博,潘福成,周晓锋,李帅..基于二阶价值梯度模型强化学习的工业过程控制方法[J].计算机应用研究,2024,41(8):P.2434-2440,7.基金项目
中国科学院沈阳自动化研究所基础研究计划资助项目(2022000346)。 (2022000346)