控制理论与应用2006,Vol.23Issue(4):547-551,5.
随机平稳策略下半Markov决策过程的仿真优化算法
Simulation optimization algorithm for SMDPs with parameterized randomized stationary policies
摘要
关键词
随机平稳策略/等价Markov过程/一致化Markov链/神经元动态规划/仿真优化分类
信息技术与安全科学引用本文复制引用
代桂平,唐昊,奚宏生..随机平稳策略下半Markov决策过程的仿真优化算法[J].控制理论与应用,2006,23(4):547-551,5.基金项目
国家自然科学基金资助项目(60274012) (60274012)
北京工业大学博士科研启动基金资助项目(00194). (00194)