基于近端策略优化算法的端到端车道保持算法研究OA
An end-to-end lane keeping algorithm based on the Proximal Policy Optimization algorithm
为提高车道保持算法的成功率,增强无人车导航能力,提出了一种基于改进的近端策略优化算法(Proxi-mal Policy Optimization,PPO)的端到端车道保持算法研究.通过将PPO算法中的一个隐藏层替换为LSTM网络及重新设计奖励函数创建端到端的车道保持算法框架,该框架可以将用于训练的算法策略与模拟器相结合,框架以车前方摄像头的RGB图像、深度图像、无人车的速度、偏离车道线值与碰撞系数等无人车周围环境变量为输入,以车前方摄像头的油门、…查看全部>>
To improve the success rate of unmanned driving and enhance the navigation ability of unmanned vehicles,this paper proposes an end-to-end lane keeping algorithm based on an improved Proximal Policy Optimization(PPO)algorithm.This article cre-ates an end-to-end unmanned driving framework by replacing a hidden layer in the PPO algorithm with an LSTM network and rede-signing a reward function.The framework can combine algorithm strategies for training with simu…查看全部>>
宋建辉;崔永阔
沈阳理工大学,沈阳 110159沈阳理工大学,沈阳 110159
电子信息工程
自动驾驶强化学习近端策略优化长短期记忆网络
Autonomous drivingReinforcement learningNear end strategy optimizationLong and short term memory network
《通信与信息技术》 2024 (3)
92-97,6
辽宁省教育厅高等学校基本科研项目(项目编号:LJKZ0275)沈阳市中青年科技创新人才支持计划项目(项目编号RC210247)
评论