概率预测强化学习下非结构环境机械臂变阻抗力跟踪控制OACSTPCD
针对非结构环境下末端实时移动机械臂阻抗控制力跟踪问题,通过动态调节阻尼系数以应对接触环境的不确定性。为确保阻抗策略的高效搜索,利用机械臂与接触环境交互产生状态-动作序列构建概率预测模型(PPM)。学习过程中,机械臂仅需与非结构接触环境进行少量交互即可获得最优变阻抗策略,这使得该过程在真实机械臂上直接训练成为可能。仿真实验表明,在几种非结构环境下,所提出的方法使力跟踪动态和稳态性能均明显优于传统阻抗控制和自适应变阻抗控制。
董梓呈;胡伟石;邵辉;郭霖;
华侨大学信息科学与工程学院,福建厦门361021华侨大学实验室与设备管理处,福建厦门361021
计算机与自动化
变阻抗控制机械臂力跟踪强化学习非结构环境概率预测模型
《华侨大学学报(自然科学版)》 2024 (004)
P.461-470 / 10
福建省自然科学基金资助项目(2021J01291);华侨大学研究生教育教学改革研究项目(22YJG006)。
评论