监督式强化学习在路径规划中的应用研究OA北大核心CSTPCD

RESEARCH OF PATH PLANNING BASED ON THE SUPERVISED REINFORCEMENT LEARNING

中文摘要

机器学习分为监督式学习、非监督式学习和强化学习.由于强化学习在学习收敛方面速度较慢,难以在实际控制系统中大规模应用.为解决以上问题,提出一种基于标称控制的监督式强化学习算法,并将其用于机器人的路径规划当中.在训练初始阶段引入导师的先验知识,以增加系统的学习效果,同时逐步弱化导师的监督指导作用,发挥强化学习探索优化的优势,让机器人尽快找到最优路径.针对机器人的路径规划问题,提出其监督式学习算法,进行实验对比分析.结果显示,监督式强化学习能有效降低…查看全部>>

作者：曾纪钧;梁哲恒

作者单位：广东电网有限责任公司信息中心广东广州510080中国南方电网公司信息化评测重点实验室广东广州510080

分类：信息技术与安全科学

中文关键词：监督式强化学习路径规划

刊名：《计算机应用与软件》 2018 (10)

页码/页数：185-188,244,5

DOI：10.3969/j.issn.1000-386x.2018.10.033

您当前未登录！

去登录

点击加载更多...

监督式强化学习在路径规划中的应用研究OA北大核心CSTPCD

RESEARCH OF PATH PLANNING BASED ON THE SUPERVISED REINFORCEMENT LEARNING

评论