基于强化学习的机器人底盘能量管理与路径规划优化算法OA北大核心CSTPCD
为解决温室机器人底盘传统路径规划中因忽略地面粗糙度而导致的电池寿命缩短与利用效率低下的问题,该研究探讨了3种融合电池能量管理与路径规划的强化学习算法。首先,基于先验知识构建分级预打分奖励模型,并通过增加曼哈顿距离构建奖励函数,提高电池寿命和利用率;其次,针对传统Q-Learning(QL)算法收敛效率低、易陷入局部最优等问题,提出了自适应变步长的优化算法(adaptive multi-step q-learning,AMQL)和基于自适应改变探索…查看全部>>
李潇宇;张君华;郭晓光;伍纲
北京信息科技大学机电工程学院,北京100192北京信息科技大学机电工程学院,北京100192北京信息科技大学机电工程学院,北京100192中国农业科学院农业环境与可持续发展研究所,北京100081
农业工程
温室路径规划强化学习能量管理多目标优化
《农业工程学报》 2024 (21)
P.175-183,9
国家自然科学基金项目(12272057)。
评论