首页|期刊导航|重庆科技学院学报(自然科学版)|基于改进Sarsa算法的拖轮动态调度方法

基于改进Sarsa算法的拖轮动态调度方法OA

Tugboat Dynamic Scheduling Method Based on Improved Sarsa Algorithm

中文摘要英文摘要

从优化Sarsa算法的角度展开拖轮动态调度方法研究.采用强化学习框架并结合拖轮的状态和环境信息,建立状态-动作函数,进而搜索拖轮调度最佳策略.改进Sarsa算法中Q函数的更新方式,以克服收敛速度慢的问题.同时,根据学习率选择模式和动作选择方式,对探索策略与利用策略加以平衡,以提高算法的收敛速度和性能.算例仿真实验结果表明,采用该算法可有效缩短船舶等待时间,进而提升拖轮资源的利用效率.

Aiming at the shortcomings of the traditional Sarsa algorithm,the optimization of tugboat dynamic schedu-ling method is studied.Based on the reinforcement learning framework and the state and environment information of tugboats,the state-action function is established to search the optimal strategy of tugboats scheduling decision.The update method of Q function in Sarsa algorithm is changed to overcome the problem of slow convergence.At the same time,accordi…查看全部>>

李佳琛;段兴锋

集美大学 航海学院,福建 厦门 361000集美大学 航海学院,福建 厦门 361000

计算机与自动化

Sarsa算法拖轮自适应调度强化学习算法策略

Sarsa algorithmtugboatsadaptive schedulingreinforcement learningalgorithm strategy

《重庆科技学院学报(自然科学版)》 2024 (3)

42-48,7

福建省自然科学基金项目"海上智能调度"(2019J01325)

10.19406/j.issn.1673-1980.2024.03.007

评论

您当前未登录!去登录点击加载更多...