采用DDPG的双足机器人自学习步态规划方法OA北大核心CSCDCSTPCD
Self-Learning Gait Planning Method for Biped Robot Using DDPG
为解决多自由度双足机器人步行控制中高维非线性规划难题,挖掘不确定环境下双足机器人自主运动潜力,提出了一种改进的基于深度确定性策略梯度算法(DDPG)的双足机器人步态规划方案.把双足机器人多关节自由度控制问题转化为非线性函数的多目标优化求解问题,采用DDPG算法来求解.为解决全局逼近网络求解过程收敛慢的问题,采用径向基(RBF)神经网络进行非线性函数值的计算,并采用梯度下降算法更新神经网络权值,采用SumTree来筛选优质样本.通过ROS、Gaze…查看全部>>
周友行;赵晗妘;刘汉江;李昱泽;肖雨琴
湘潭大学 机械工程学院,湖南 湘潭 411105湘潭大学 机械工程学院,湖南 湘潭 411105湘潭大学 机械工程学院,湖南 湘潭 411105湘潭大学 机械工程学院,湖南 湘潭 411105湘潭大学 机械工程学院,湖南 湘潭 411105
信息技术与安全科学
双足机器人步态规划深度确定性策略梯度算法(DDPG)径向基函数(RBF)神经网络SumTreeGazebo
《计算机工程与应用》 2021 (6)
介观尺度下海泡石矿粉射流研究与提纯分级装备设计
254-259,6
国家自然科学基金(51775468,51375419).