基于递阶强化学习的多智能体AGV 调度系统 Multiagent AGV dispatching system based on hierarchical reinforcement learning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于递阶强化学习的多智能体AGV 调度系统

引用本文：	李晓萌,杨煜普,许晓鸣.基于递阶强化学习的多智能体AGV 调度系统[J].控制与决策,2002,17(3):292-296.

作者姓名：	李晓萌杨煜普许晓鸣

作者单位：	上海交通大学,自动化研究所,上海,200030

摘要：	递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的AGV调度系统需要实时动态的调度方法，而具有MaxQ递阶强化学习能力的多智能体通过高效的强化学习方法和协作，可以实现AGV的实时调度。仿真实验证明了这种方法的有效性。
关键词：	递阶强化学习多智能体 AGV调度系统机器学习
文章编号：	1001-0920(2002)03-0292-05
修稿时间：	2000年12月26
Multiagent AGV dispatching system based on hierarchical reinforcement learning

LI Xiao meng,YANG Yu pu,XU Xiao ming.Multiagent AGV dispatching system based on hierarchical reinforcement learning[J].Control and Decision,2002,17(3):292-296.

Authors:	LI Xiao meng YANG Yu pu XU Xiao ming

Abstract:	Hierarchical reinforcement learning is an effective method of solving decision problems for complex systems with enormous number of states. AGV dispatching system needs dynamic dispatching rules because of its discrete and dynamic properties. Multiagent with the capacity of Max Q hierarchical reinforcement learning is implemented in real time AGV dispatching by high performance learning and cooperation. The simulation testifies the efficiency of this method.

Keywords:	hierarchical reinforcement learning Max Q method cooperative multiagent AGV dispatching
本文献已被 CNKI 维普万方数据等数据库收录！
	点击此处可从《控制与决策》浏览原始摘要信息
	点击此处可从《控制与决策》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏