自动化学报2024,Vol.50Issue(4):P.828-840,13.DOI:10.16383/j.aas.c230018
基于距离信息的追逃策略:信念状态连续随机博弈
摘要
关键词
追逃问题/信念区域状态/连续随机博弈/马尔科夫决策过程/强化学习分类
数理科学引用本文复制引用
陈灵敏,冯宇,李永强..基于距离信息的追逃策略:信念状态连续随机博弈[J].自动化学报,2024,50(4):P.828-840,13.基金项目
国家自然科学基金(61973276,62073294) (61973276,62073294)
浙江省自然科学基金(LZ21F030003)资助。 (LZ21F030003)