基于深度强化学习的柔性作业车间节能调度研究 |
| |
引用本文: | 张中伟,李艺,高增恩,武照云.基于深度强化学习的柔性作业车间节能调度研究[J].工业工程,2024(1):78-85+103. |
| |
作者姓名: | 张中伟 李艺 高增恩 武照云 |
| |
作者单位: | 河南工业大学机电工程学院河南省超硬磨料磨削装备重点实验室 |
| |
基金项目: | 国家自然科学基金资助项目(U1704156);;河南省科技攻关计划资助项目(212102210357);;河南省高等学校重点科研资助项目(23A460003); |
| |
摘 要: | 针对当前柔性作业车间节能调度研究无法充分利用历史生产数据,且对复杂、动态、多变的车间生产环境适应性不足的问题,引入深度强化学习思想,利用具有代表性的深度Q网络(deep Q-network, DQN)求解柔性作业车间节能调度问题。将柔性作业车间节能调度问题转化为强化学习对应的马尔科夫决策过程。进而,提炼表征车间生产状态特征的状态值作为神经网络输入,通过神经网络拟合状态值函数,输出复合调度动作规则实现对工件以及加工机器的选择,并利用动作规则与奖励函数协同优化能耗。在3个不同规模的案例上与非支配排序遗传算法、超启发式遗传算法、改进狼群算法等典型智能优化方法进行求解效果对比。结果表明,DQN算法有较强的搜索能力,且最优解分布情况与提出的柔性作业车间节能调度模型聚焦能耗目标相一致,从而验证了所用DQN方法的有效性。
|
关 键 词: | 柔性作业车间节能调度 深度强化学习 深度Q网络 马尔科夫决策 |
|