首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度强化学习的作业车间调度问题优化
作者姓名:乔东平  段绿旗  黎宏磊  肖艳秋
作者单位:1. 河南省机械装备智能制造重点实验室;2. 郑州轻工业大学机械工程学院
基金项目:河南省高等学校重点科研项目计划支持(20A460029);
摘    要:针对作业车间调度问题求解的复杂性,以最小化最大完工时间为目标,提出基于深度强化学习优化算法求解作业车间调度问题。首先,基于析取图模型构建深度强化学习的调度环境,并建立三通道状态特征,设计20种复合启发式调度规则作为动作空间,将奖励函数等价为机器利用率;利用深度卷积神经网络搭建动作网络和目标网络,以状态作为输入,输出每个动作的Q值,进而使用行动有效性探索和利用策略选取动作;最后,计算即时奖励和更新调度环境。使用标准案例验证了算法可以平衡求解质量和时间,训练好的智能体对非零初始状态下调度问题具有很好的泛化性。

关 键 词:深度强化学习  作业车间调度  调度规则
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号