面向柔性作业车间生产调度的深度强化学习方法OA北大核心CSTPCD
针对多品种、小批量生产模式下柔性作业车间生产调度问题,以最小化订单总拖期时间为优化目标,提出一种基于组合规则和强化学习的智能调度方法。将柔性作业车间生产调度问题转换为马尔可夫决策过程,根据问题特点与优化目标,利用7种特征表征车间状态,设计6种组合式规则作为动作库,通过改进后的深度Q网络(DQN)算法对该问题进行求解。以航天结构件加工车间为案例,分别在5种不同规模大小的算例中,与其他常见的规则式方法进行对比,验证了所提方法缩短任务交付期的可行性和有效性。
祝正宇;郭具涛;吕佑龙;左丽玲;张洁;
东华大学机械工程学院,上海201620上海航天精密机械研究所,上海201600东华大学人工智能研究院,上海200620
计算机与自动化
生产调度柔性作业车间深度强化学习深度Q网络
《中国机械工程》 2024 (011)
P.2007-2014,2034 / 9
国家自然科学基金(52375486);上海市“科技创新行动计划”高新技术领域项目(22511101903)。
评论