首页|期刊导航|控制理论与应用|随机平稳策略下半Markov决策过程的仿真优化算法

随机平稳策略下半Markov决策过程的仿真优化算法

代桂平唐昊奚宏生

控制理论与应用2006，Vol.23Issue(4)：547-551,5.

Simulation optimization algorithm for SMDPs with parameterized randomized stationary policies

代桂平 ¹唐昊 ²奚宏生³

作者信息

随机平稳策略/等价Markov过程/一致化Markov链/神经元动态规划/仿真优化

信息技术与安全科学

代桂平,唐昊,奚宏生..随机平稳策略下半Markov决策过程的仿真优化算法[J].控制理论与应用,2006,23(4):547-551,5.

国家自然科学基金资助项目(60274012) （60274012）

北京工业大学博士科研启动基金资助项目(00194). （00194）

OA北大核心CSCDCSTPCD

ISSN：1000-8152

访问量0

下载量0

段落导航