| 注册
首页|期刊导航|控制理论与应用|随机平稳策略下半Markov决策过程的仿真优化算法

随机平稳策略下半Markov决策过程的仿真优化算法

代桂平 唐昊 奚宏生

控制理论与应用2006,Vol.23Issue(4):547-551,5.
控制理论与应用2006,Vol.23Issue(4):547-551,5.

随机平稳策略下半Markov决策过程的仿真优化算法

Simulation optimization algorithm for SMDPs with parameterized randomized stationary policies

代桂平 1唐昊 2奚宏生3

作者信息

  • 1. 北京工业大学,电子信息与控制学院,北京,100022
  • 2. 中国科学技术大学,自动化系,安徽,合肥,230027
  • 3. 合肥工业大学,计算机系,安徽,合肥,230009
  • 折叠

摘要

关键词

随机平稳策略/等价Markov过程/一致化Markov链/神经元动态规划/仿真优化

分类

信息技术与安全科学

引用本文复制引用

代桂平,唐昊,奚宏生..随机平稳策略下半Markov决策过程的仿真优化算法[J].控制理论与应用,2006,23(4):547-551,5.

基金项目

国家自然科学基金资助项目(60274012) (60274012)

北京工业大学博士科研启动基金资助项目(00194). (00194)

控制理论与应用

OA北大核心CSCDCSTPCD

1000-8152

访问量0
|
下载量0
段落导航相关论文