首页|期刊导航|数据采集与处理|基于多任务强化学习的地形自适应模仿学习方法

基于多任务强化学习的地形自适应模仿学习方法OA北大核心CSTPCD

Terrain-Adaptive Motion Imitation Based on Multi-task Reinforcement Learning

中文摘要

英文摘要

地形自适应能力是智能体在复杂地形条件下稳定运动的基础,而由于机器人动力学系统的复杂性,传统逆动力学方法通常难以使其具备这种能力.现有利用强化学习在解决序列决策问题上的优势训练智能体地形适应能力的单任务学习方法无法有效学习各类地形中的相关性.事实上,复杂地形自适应任务可以认为是一种多任务,子任务间的关系可以用不同地形影响因素来衡量,通过子任务模型的相互学习解决数据分布信息获取不全面的问题.基于此,本文提出一种多任务强化学习方法.该方法包含1个由子任…查看全部>>

Terrain adaptive ability is the basis for the stable movement of agents under complex terrain conditions.Due to the complexity of the dynamical systems of these agents,such as humanoid robots,it is usually difficult for traditional inverse dynamics methods to have such ability.Recent research has used the advantages of reinforcement learning in solving sequential decision-making problems to train agents to adapt to terrain.However,these single-task learning …查看全部>>

作者：余昊;梁宇宸;张驰;刘跃虎

作者单位：西安交通大学软件学院,西安 710049西安交通大学人工智能学院,西安 710049西安交通大学人工智能学院,西安 710049西安交通大学人工智能学院,西安 710049

分类：计算机与自动化

中文关键词：多任务学习模仿学习强化学习地形影响因素LeggedGym地形仿真器

英文关键词：multi-task learninglearning by imitationreinforcement learningterrain influencing factorLeggedGym terrain simulator

刊名：《数据采集与处理》 2024 (5)

页码/页数：1182-1191,10

基金：科技创新2030"新一代人工智能"重大项目(2018AAA0102504).

DOI：10.16337/j.1004-9037.2024.05.010

您当前未登录！

去登录

点击加载更多...

基于多任务强化学习的地形自适应模仿学习方法OA北大核心CSTPCD

Terrain-Adaptive Motion Imitation Based on Multi-task Reinforcement Learning

评论