基于分步迁移策略的苹果采摘机械臂轨迹规划方法OA北大核心CSCDCSTPCD
Trajectory Planning Method for Apple Picking Manipulator Based on Stepwise Migration Strategy
针对非结构化自然环境使基于深度强化学习的采摘轨迹规划训练效率低的问题,提出了基于分步迁移策略的深度确定性策略梯度算法(DDPG),并进行了苹果采摘轨迹规划.首先,提出了基于DDPG的渐进空间约束分步训练策略;其次,利用迁移学习思想,将轨迹规划的最优策略由无障碍场景迁移到单一障碍场景、由单一障碍场景迁移到混杂障碍场景;最后,对多自由度苹果采摘机械臂进行了采摘轨迹规划仿真实验,结果表明,分步迁移策略能够提高DDPG算法的训练效率与网络性能,仿真实验验证了本文方法的有效性.
郑嫦娥;高坡;GAN Hao;田野;赵燕东
北京林业大学工学院,北京100083北京林业大学工学院,北京100083田纳西大学生物系统工程及土壤科学系,诺克斯维尔TN37996北京林业大学工学院,北京100083北京林业大学工学院,北京100083
信息技术与安全科学
苹果采摘机械臂轨迹规划深度确定性策略梯度算法迁移学习
《农业机械学报》 2020 (12)
15-23,9
国家自然科学基金面上项目(31971668)
评论