多Agent MDPs中并行Rollout学习算法 |
| |
作者姓名: | 李豹 |
| |
作者单位: | 中国人民银行芜湖市中心支行,安徽芜湖,241000 |
| |
摘 要: | 文章在rollout算法基础上研究了在多Agent MDPs的学习问题.利用神经元动态规划逼近方法来降低其空间复杂度,从而减少算法"维数灾".由于Rollout算法具有很强的内在并行性,文中还分析了并行求解方法.通过多级仓库库存控制的仿真试验,验证了Rollout算法在多Agent学习中的有效性.
|
关 键 词: | rollout算法 神经元动态规划 多Agent学习 性能势 并行算法 |
本文献已被 CNKI 万方数据 等数据库收录! |
|