首页 | 本学科首页   官方微博 | 高级检索  
     

多Agent MDPs中并行Rollout学习算法
作者姓名:李豹
作者单位:中国人民银行芜湖市中心支行,安徽芜湖,241000
摘    要:文章在rollout算法基础上研究了在多Agent MDPs的学习问题.利用神经元动态规划逼近方法来降低其空间复杂度,从而减少算法"维数灾".由于Rollout算法具有很强的内在并行性,文中还分析了并行求解方法.通过多级仓库库存控制的仿真试验,验证了Rollout算法在多Agent学习中的有效性.

关 键 词:rollout算法  神经元动态规划  多Agent学习  性能势  并行算法
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号