首页 | 本学科首页   官方微博 | 高级检索  
     

基于递阶强化学习的多智能体AGV 调度系统
引用本文:李晓萌,杨煜普,许晓鸣.基于递阶强化学习的多智能体AGV 调度系统[J].控制与决策,2002,17(3):292-296.
作者姓名:李晓萌  杨煜普  许晓鸣
作者单位:上海交通大学,自动化研究所,上海,200030
摘    要:递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的AGV调度系统需要实时动态的调度方法,而具有MaxQ递阶强化学习能力的多智能体通过高效的强化学习方法和协作,可以实现AGV的实时调度。仿真实验证明了这种方法的有效性。

关 键 词:递阶强化学习  多智能体  AGV调度系统  机器学习
文章编号:1001-0920(2002)03-0292-05
修稿时间:2000年12月26

Multiagent AGV dispatching system based on hierarchical reinforcement learning
LI Xiao meng,YANG Yu pu,XU Xiao ming.Multiagent AGV dispatching system based on hierarchical reinforcement learning[J].Control and Decision,2002,17(3):292-296.
Authors:LI Xiao meng  YANG Yu pu  XU Xiao ming
Abstract:Hierarchical reinforcement learning is an effective method of solving decision problems for complex systems with enormous number of states. AGV dispatching system needs dynamic dispatching rules because of its discrete and dynamic properties. Multiagent with the capacity of Max Q hierarchical reinforcement learning is implemented in real time AGV dispatching by high performance learning and cooperation. The simulation testifies the efficiency of this method.
Keywords:hierarchical reinforcement learning  Max  Q  method  cooperative multiagent  AGV dispatching
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《控制与决策》浏览原始摘要信息
点击此处可从《控制与决策》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号