基于DDPG算法的无人船动态目标跟踪控制OACSTPCD
为了实现无人船在复杂海况上对目标的追踪,使用DDPG(Deep Deterministic Policy Gradient)算法对无人船进行运动控制,使无人船完成对运动目标的快速追踪。在Simulink中使用Nomoto模型对无人船的运动模型进行建模。针对无人船的运动具有大迟滞性的特点对无人船的状态量进行重构,使无人船智能体可以通过重构的状态空间观测到状态量的高阶差分量。为无人船对运动目标追踪的任务设置了不易陷入局部最优解的奖励函数,最终强化学习智能体通过与环境的交互学会了有效地控制无人船对运动目标进行追踪,验证了算法的有效性。
李浩东;林伟;袁毓;胡智威;冯友兵;
江苏科技大学电子信息学院,镇江212100
计算机与自动化
DDPG无人船运动控制运动目标追踪
《计算机与数字工程》 2024 (008)
P.2361-2366,2399 / 7
评论