首页 | 本学科首页   官方微博 | 高级检索  
     

面向多机动态调度问题的两层Q学习算法
引用本文:王国磊,钟诗胜,林琳.面向多机动态调度问题的两层Q学习算法[J].智能系统学报,2009,4(3):239-244.
作者姓名:王国磊  钟诗胜  林琳
作者单位:哈尔滨工业大学,机电工程学院,黑龙江,哈尔滨,150001
基金项目:国家高技术研究发展计划(863计划) 
摘    要:对于单机动态调度问题十分有效的Q学习,在多机动态调度环境下却由于缺乏全局眼光而效果欠佳,因此提出了一种双层Q学习算法.底层Q学习着眼于局部,以最小化设备空闲和作业平均流经时间为目标,学习单机调度策略;而顶层Q学习则着眼于全局,以平衡机器负载、最小化整体拖期值为目标,学习如何分配作业到合适机器.文中分别给出了两层Q学习的动作集、状态空间划分方式和奖惩函数设计,并通过对多机动态调度问题的仿真实验表明,提出的双层Q学习能够很好地解决改善动态环境下多机调度问题.

关 键 词:动态多机调度  Q学习  动作集  状态空间划分  奖惩函数

Bi-level Q-learning algorithm for dynamic multi-machine scheduling problems
WANG Guo-lei,ZHONG Shi-sheng,LIN Lin.Bi-level Q-learning algorithm for dynamic multi-machine scheduling problems[J].CAAL Transactions on Intelligent Systems,2009,4(3):239-244.
Authors:WANG Guo-lei  ZHONG Shi-sheng  LIN Lin
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号