首页 | 本学科首页   官方微博 | 高级检索  
     

可重入生产系统的平均报酬型强化学习调度
作者姓名:柳长春  沈志江  于海斌
作者单位:中国科学院沈阳自动化研究所,辽宁,沈阳,110016
基金项目:国家自然科学基金资助项目 (699740 3 9)
摘    要:在可重入生产系统中,一个重要的问题就是对调度策略进行优化,以提高系统平均输出率.本文采用了一种平均报酬型强化学习算法来解决该问题,直接从所关心的系统品质出发,自动获得具有自适应性 的动态调度策略.仿真结果表明,其性能优于两种熟知的优先权调度策略.

关 键 词:平均报酬型强化学习  可重入系统  调度  暂态差分
文章编号:1002-0411(2004)02-0145-06
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《信息与控制》浏览原始摘要信息
点击此处可从《信息与控制》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号