基于深度强化学习的作业车间调度问题优化 |
| |
作者姓名: | 乔东平 段绿旗 黎宏磊 肖艳秋 |
| |
作者单位: | 1. 河南省机械装备智能制造重点实验室;2. 郑州轻工业大学机械工程学院 |
| |
基金项目: | 河南省高等学校重点科研项目计划支持(20A460029); |
| |
摘 要: | 针对作业车间调度问题求解的复杂性,以最小化最大完工时间为目标,提出基于深度强化学习优化算法求解作业车间调度问题。首先,基于析取图模型构建深度强化学习的调度环境,并建立三通道状态特征,设计20种复合启发式调度规则作为动作空间,将奖励函数等价为机器利用率;利用深度卷积神经网络搭建动作网络和目标网络,以状态作为输入,输出每个动作的Q值,进而使用行动有效性探索和利用策略选取动作;最后,计算即时奖励和更新调度环境。使用标准案例验证了算法可以平衡求解质量和时间,训练好的智能体对非零初始状态下调度问题具有很好的泛化性。
|
关 键 词: | 深度强化学习 作业车间调度 调度规则 |
|
|