首页|期刊导航|自动化学报|基于距离信息的追逃策略:信念状态连续随机博弈

基于距离信息的追逃策略:信念状态连续随机博弈

陈灵敏冯宇李永强

自动化学报2024，Vol.50Issue(4)：P.828-840,13.

自动化学报2024，Vol.50Issue(4)：P.828-840,13.DOI:10.16383/j.aas.c230018

陈灵敏 ¹冯宇 ¹李永强¹

作者信息

追逃问题/信念区域状态/连续随机博弈/马尔科夫决策过程/强化学习

数理科学

陈灵敏,冯宇,李永强..基于距离信息的追逃策略:信念状态连续随机博弈[J].自动化学报,2024,50(4):P.828-840,13.

国家自然科学基金(61973276,62073294) （61973276,62073294）

浙江省自然科学基金(LZ21F030003)资助。（LZ21F030003）

OA北大核心CSTPCD

ISSN：0254-4156

访问量5

下载量0

段落导航