监督式强化学习在路径规划中的应用研究OA北大核心CSTPCD
RESEARCH OF PATH PLANNING BASED ON THE SUPERVISED REINFORCEMENT LEARNING
机器学习分为监督式学习、非监督式学习和强化学习.由于强化学习在学习收敛方面速度较慢,难以在实际控制系统中大规模应用.为解决以上问题,提出一种基于标称控制的监督式强化学习算法,并将其用于机器人的路径规划当中.在训练初始阶段引入导师的先验知识,以增加系统的学习效果,同时逐步弱化导师的监督指导作用,发挥强化学习探索优化的优势,让机器人尽快找到最优路径.针对机器人的路径规划问题,提出其监督式学习算法,进行实验对比分析.结果 显示,监督式强化学习能有效降低…查看全部>>
曾纪钧;梁哲恒
广东电网有限责任公司信息中心 广东广州510080中国南方电网公司信息化评测重点实验室 广东广州510080
信息技术与安全科学
监督式强化学习路径规划
《计算机应用与软件》 2018 (10)
185-188,244,5
评论