首页|期刊导航|计算机应用与软件|监督式强化学习在路径规划中的应用研究

监督式强化学习在路径规划中的应用研究OA北大核心CSTPCD

RESEARCH OF PATH PLANNING BASED ON THE SUPERVISED REINFORCEMENT LEARNING

中文摘要

机器学习分为监督式学习、非监督式学习和强化学习.由于强化学习在学习收敛方面速度较慢,难以在实际控制系统中大规模应用.为解决以上问题,提出一种基于标称控制的监督式强化学习算法,并将其用于机器人的路径规划当中.在训练初始阶段引入导师的先验知识,以增加系统的学习效果,同时逐步弱化导师的监督指导作用,发挥强化学习探索优化的优势,让机器人尽快找到最优路径.针对机器人的路径规划问题,提出其监督式学习算法,进行实验对比分析.结果 显示,监督式强化学习能有效降低…查看全部>>

曾纪钧;梁哲恒

广东电网有限责任公司信息中心 广东广州510080中国南方电网公司信息化评测重点实验室 广东广州510080

信息技术与安全科学

监督式强化学习路径规划

《计算机应用与软件》 2018 (10)

185-188,244,5

10.3969/j.issn.1000-386x.2018.10.033

评论

您当前未登录!去登录点击加载更多...