首页|期刊导航|计算机应用研究|基于轨迹引导的移动机器人导航策略优化算法

基于轨迹引导的移动机器人导航策略优化算法OA北大核心CSTPCD

中文摘要

针对在杂乱、障碍物密集的复杂环境下移动机器人使用深度强化学习进行自主导航所面临的探索困难,进而导致学习效率低下的问题,提出了一种基于轨迹引导的导航策略优化(TGNPO)算法。首先,使用模仿学习的方法为移动机器人训练一个能够同时提供专家示范行为与导航轨迹预测功能的专家策略,旨在全面指导深度强化学习训练;其次,将专家策略预测的导航轨迹与当前时刻移动机器人所感知的实时图像进行融合,并结合坐标注意力机制提取对移动机器人未来导航起引导作用的特征区域,提高导航模型的学习性能;最后,使用专家策略预测的导航轨迹对移动机器人的策略轨迹进行约束,降低导航过程中的无效探索和错误决策。通过在仿真和物理平台上部署所提算法,实验结果表明,相较于现有的先进方法,所提算法在导航的学习效率和轨迹平滑方面取得了显著的优势。这充分证明了该算法能够高效、安全地执行机器人导航任务。

作者：李忠伟;刘伟鹏;罗偲;

作者单位：中国石油大学(华东)海洋与空间信息学院,山东青岛266580

分类：计算机与自动化

中文关键词：移动机器人自主导航轨迹预测轨迹-图像融合轨迹约束深度强化学习

刊名：《计算机应用研究》 2024 (005)

页码/页数：P.1456-1461 / 6

基金： 国家自然科学基金面上项目(62071491);校自主创新科研计划项目(理工科)-战略专项资助项目(22CX01004A-1)。

DOI：10.19734/j.issn.1001-3695.2023.09.0422

基于轨迹引导的移动机器人导航策略优化算法OA北大核心CSTPCD

评论