首页|期刊导航|计算机工程与科学|基于Q-learning的不确定环境BDI Agent最优策略规划研究

基于Q-learning的不确定环境BDI Agent最优策略规划研究OA北大核心CSCDCSTPCD

Optimal strategy planning of BDI agent based on Q-learning in uncertain environments

中文摘要

BDI模型能够很好地解决在特定环境下的Agent的推理和决策问题,但在动态和不确定环境下缺少决策和学习的能力.强化学习解决了Agent在未知环境下的决策问题,却缺少BDI模型中的规则描述和逻辑推理.针对BDI在未知和动态环境下的策略规划问题,提出基于强化学习Q-learning算法来实现BDI Agent学习和规划的方法,并针对BDI的实现模型ASL的决策机制做出了改进,最后在ASL的仿真平台Jason上建立了迷宫的仿真,仿真实验表明,在加入Q-…查看全部>>

WAN Qian;LIU Wei;XU Long-long;GUO Jing-zhi

信息技术与安全科学

BDI Agent强化学习Q-learningASLJason规划

《计算机工程与科学》 2019 (1)

基于构件能力动态规划的自适应软件群体决策方法及其应用研究

166-172,7

国家自然科学基金(61502355)武汉工程大学第九届研究生教育创新基金(CX2017068)

10.3969/j.issn.1007-130X.2019.01.022

评论

您当前未登录!去登录点击加载更多...