首页|期刊导航|电子学报|未知环境下基于深度序列蒙特卡罗树搜索的信源导航方法

未知环境下基于深度序列蒙特卡罗树搜索的信源导航方法OA北大核心CSTPCD

DS-MCTS:A Deep Sequential Monte-Carlo Tree Search Method for Source Navigation in Unknown Environments

中文摘要

信源导航在应急救援、工业巡检及其他危险作业中具有重要应用意义.在实际应用中,环境的状态信息往往是难以完全观测的,即部分可观测环境.如何利用观测到的部分环境信息做出实时决策,并基于历史序列信息对系统未来状态进行有效的预测,成为信源导航相关研究所面临的挑战性问题.本文提出一种基于深度序列蒙特卡洛树搜索(Deep Sequential Monte-Carlo Tree Search,DS-MCTS)的信源导航算法和系统框架,基于序列动作预测(Se?quential Action Prediction,SAP)网络为MCTS决策提供先验知识,构建奖励分配预测(Reward Allocation Prediction,RAP)网络提高奖励分配精度,最终实现系统的最优化决策.仿真实验表明,DS-MCTS方法提供了一种端到端的信源导航解决方案,可以实现智能体动作的有效预测,实现高效、鲁棒的路径规划.

段世红;何昊;徐诚;殷楠;王然

北京科技大学计算机与通信工程学院,北京100083北京科技大学顺德研究生院,广东佛山528399北京科技大学计算机与通信工程学院,北京100083北京科技大学顺德研究生院,广东佛山528399北京科技大学计算机与通信工程学院,北京100083

信息技术与安全科学

信源导航蒙特卡洛树搜索序贯决策路径规划深度强化学习

《电子学报》 2022 (7)

面向不确定环境下应急救援的协同搜索模型及关键算法研究

1744-1752,9

国家自然科学基金(No.62101029)博士后创新人才支持计划(No.BX20190033)广东省基础与应用基础研究基金联合基金(No.2019A1515110325)中国博士后基金面上项目(No.2020M670135)北京科技大学顺德研究生院博士后科研经费(No.2020BH001)中央高校基本科研业务费(No.06500127)

10.12263/DZXB.20211252

评论