南京大学学报(自然科学版)2013,Vol.49Issue(4):439-447,9.
逻辑马尔可夫决策过程的正则条件概率理论
Theory for regularly conditional probability of logical Markov decision process
摘要
关键词
概率测度空间/逻辑马尔可夫决策过程/正则条件概率/增强学习Key words
probability measure space/logical Markov decision process/regularly conditional probability/reinforcement learning引用本文复制引用
王蓁蓁,邢汉承..逻辑马尔可夫决策过程的正则条件概率理论[J].南京大学学报(自然科学版),2013,49(4):439-447,9.基金项目
金陵科技学院科研基金(jit-b-201207) (jit-b-201207)