| 注册
首页|期刊导航|计算机应用研究|基于二阶价值梯度模型强化学习的工业过程控制方法

基于二阶价值梯度模型强化学习的工业过程控制方法

张博 潘福成 周晓锋 李帅

计算机应用研究2024,Vol.41Issue(8):P.2434-2440,7.
计算机应用研究2024,Vol.41Issue(8):P.2434-2440,7.DOI:10.19734/j.issn.1001-3695.2023.11.0580

基于二阶价值梯度模型强化学习的工业过程控制方法

张博 1潘福成 2周晓锋 2李帅2

作者信息

  • 1. 中国科学院网络化控制系统重点实验室,沈阳110016 中国科学院沈阳自动化研究所,沈阳110016 中国科学院机器人与智能制造创新研究院,沈阳110169 中国科学院大学,北京100049
  • 2. 中国科学院网络化控制系统重点实验室,沈阳110016 中国科学院沈阳自动化研究所,沈阳110016 中国科学院机器人与智能制造创新研究院,沈阳110169
  • 折叠

摘要

关键词

工业过程控制/模型强化学习/二阶价值梯度/状态价值函数/状态采样策略

分类

信息技术与安全科学

引用本文复制引用

张博,潘福成,周晓锋,李帅..基于二阶价值梯度模型强化学习的工业过程控制方法[J].计算机应用研究,2024,41(8):P.2434-2440,7.

基金项目

中国科学院沈阳自动化研究所基础研究计划资助项目(2022000346)。 (2022000346)

计算机应用研究

OA北大核心CSTPCD

1001-3695

访问量0
|
下载量0
段落导航相关论文