基于深度强化学习的柔性作业车间调度方法 |
| |
引用本文: | 崔雪艳, 万烂军, 赵昊鑫, 李长云. 基于深度强化学习的柔性作业车间调度方法[J]. 制造技术与机床, 2023, (12): 165-170. DOI: 10.19287/j.mtmt.1005-2402.2023.12.024 |
| |
作者姓名: | 崔雪艳 万烂军 赵昊鑫 李长云 |
| |
作者单位: | 1.湖南工业大学计算机学院,湖南 株洲 412007;2.智能信息感知及处理技术湖南省重点实验室,湖南 株洲 412007 |
| |
基金项目: | 湖南省教育厅优秀青年项目(21B0547);湖南省自然科学基金资助项目(2023JJ30217);国家自然科学基金资助项目(61702177);湖南省教育厅重点项目(21A0356) |
| |
摘 要: |  由于传统的调度方法在求解大规模柔性作业车间调度问题中存在短视性、计算时间过长和算法参数难以确定等问题,因此提出了一种有效求解大规模柔性作业车间调度问题的深度强化学习方法。首先,将柔性作业车间调度问题转化为一个多智能体马尔科夫决策过程。然后,构建一个用于求解柔性作业车间调度问题的演员评论家模型,演员网络根据状态输出调度规则,智能体根据调度规则选择合适的工序,评论家网络根据状态和奖励对演员网络的动作进行评估。最后,采用不同规模的柔性作业车间调度问题实例验证该方法的性能。实验结果表明,该方法的求解质量优于启发式调度规则,求解效率优于元启发式算法。
|
关 键 词: | 柔性作业车间调度 深度强化学习 马尔科夫决策过程 演员评论家算法 |
修稿时间: | 2023-09-25 |
|
| 点击此处可从《制造技术与机床》浏览原始摘要信息 |
|
点击此处可从《制造技术与机床》下载免费的PDF全文 |
|