基于强化学习的柴油机调速算法研究OA北大核心CSTPCD
为了更好地调节柴油机转速,提出一种强化学习–比例积分微分(proportional integral derivative, PID)控制器,并应用到了柴油机转速控制中。基于连续动作空间的柔性动作–评价(soft actor-critic, SAC)算法,结合连续型PID控制器,设计了一种强化学习–PID控制器,可代替传统PID控制的转速环。优化设计了基于演员–评论家(actor-critic)框架的输入输出和奖励函数以匹配柴油机特性,采用随机动作增加寻优效率,形成SAC-PID控制柴油机转速的网络交互结构,达到快速调整转速,减小稳定时间的效果。构建了以柴油机D6114为原型机的MATLAB/Simulink平均值模型,并利用试验数据验证了仿真模型的有效性。利用平均值模型,仿真验证了该控制算法效果。经过仿真验证本算法使柴油机转速响应曲线超调量更小,响应时间更快,鲁棒性更强,SAC-PID控制负载瞬态调速率和稳定时间均已达到1级精度指标。仿真对比验证了SAC算法的联合控制效果,结果表明其较其他算法更佳。
姚崇;董璕;李瑞;龙云;宋恩哲;
哈尔滨工程大学动力与能源工程学院,哈尔滨150001
能源与动力
柴油机调速比例积分微分控制器强化学习算法非线性复杂系统
《内燃机工程》 2024 (004)
P.71-80 / 10
检测技术与节能装置安徽省重点实验室开放基金项目(JCKJ2022A01)。
评论