可重入生产系统的平均报酬型强化学习调度期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

可重入生产系统的平均报酬型强化学习调度

作者姓名：	柳长春沈志江于海斌

作者单位：	中国科学院沈阳自动化研究所,辽宁,沈阳,110016

基金项目：	国家自然科学基金资助项目 (699740 3 9)

摘要：	在可重入生产系统中,一个重要的问题就是对调度策略进行优化,以提高系统平均输出率.本文采用了一种平均报酬型强化学习算法来解决该问题,直接从所关心的系统品质出发,自动获得具有自适应性的动态调度策略.仿真结果表明,其性能优于两种熟知的优先权调度策略.
关键词：	平均报酬型强化学习可重入系统调度暂态差分
文章编号：	1002-0411(2004)02-0145-06
本文献已被 CNKI 维普万方数据等数据库收录！
	点击此处可从《信息与控制》浏览原始摘要信息
	点击此处可从《信息与控制》下载全文