首页 | 本学科首页   官方微博 | 高级检索  
     

基于多动作深度强化学习的纺机制造车间调度方法
作者姓名:纪志勇  袁逸萍  巴智勇  樊盼盼  田芳
作者单位:1. 新疆大学机械工程学院
基金项目:国家自然科学基金资助项目(71961029);
摘    要:纺机制造车间调度问题是一种具有复杂工艺约束和序列相关设置时间的柔性作业车间调度问题,为了保证调度方案的质量,提升企业的订单准时交付能力,提出了一种以最小化最大完工期为优化目标的多动作深度强化学习算法。首先,将调度问题建模为多马尔可夫决策过程。然后,针对纺机制造车间调度的工件选择和机器选择两个子问题,分别设计了用于定义工序选择策略和机器选择策略的两个编码器,以预测选择不同工序和机器的概率分布。其中,在工序选择编码器中,采用图神经网络对析取图进行编码,以降低问题规模对解的质量的影响。其次,提出了一种具有多动作空间的强化学习训练算法,用于学习两个子策略。最后,经某纺机制造企业的实际生产案例验证,该方法的性能受问题规模影响较小,与其他对比算法相比,能够获得较高质量的调度方案,训练的模型具有较好的泛化能力和稳定性。

关 键 词:纺机制造车间调度  序列相关设置时间  深度强化学习  图神经网络  多近端策略优化算法  最大完工期
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号