上肢康复机器人主动康复策略的学习及迁移方法OA北大核心CSTPCD
为实现脑卒中患者上肢的主动康复,提出了基于强化学习的反馈控制方法,将训练过的控制策略迁移至实体环境。首先通过分析人体上肢运动,建立了人体上肢等效模型,并提出了在关节空间拟合上肢随意运动的随机轨迹规划方法;其次,基于等效模型建立了人机耦合系统的仿真环境,通过人体及机器人运动学分析将人机耦合系统的完整状态映射为可观测状态,以实现控制策略训练;最后,为了将仿真中训练的控制策略迁移至机器人样机,利用反馈控制策略对齐环境间的特征分布,避免了策略在不同环境间的负迁移。仿真结果表明,基于强化学习的控制策略可实现脑卒中患者的主动康复;将仿真中训练的控制策略迁移至现实机器人,实验结果验证了康复策略的学习与迁移方法的有效性,为运动障碍患者的主动康复提供了一种新的技术解决方案。
郭士杰;宋元昊;王旭升;刘作军;李洋;
河北工业大学智能康复装置与检测技术教育部工程研究中心,天津300130 河北工业大学省部共建电工装备可靠性与智能化国家重点实验室,天津300130 河北省机器人感知与人机融合重点实验室,天津300130上海复试智能科技有限公司,上海201306
临床医学
主动康复强化学习反馈控制人机耦合系统控制策略迁移
《机器人》 2024 (005)
P.562-575 / 14
国家自然科学基金(62303154);河北省中央引导地方科技发展资金(236Z1814G);河北省博士后科研项目择优资助经费(B2023003013)。
评论