控制理论与应用2024,Vol.41Issue(11):P.2131-2138,8.DOI:10.7641/CTA.2023.20630
对手类型未知情况下的两人零和马尔科夫博弈决策
摘要
关键词
两人零和马尔科夫博弈/非完全信息/极大极小Q学习/纳什均衡/多智能体强化学习分类
信息技术与安全科学引用本文复制引用
王成意,朱进,赵云波..对手类型未知情况下的两人零和马尔科夫博弈决策[J].控制理论与应用,2024,41(11):P.2131-2138,8.基金项目
国家重点研发计划项目(2018AAA0100802) (2018AAA0100802)
安徽省自然科学基金项目(2008085MF198)资助. (2008085MF198)