首页 | 本学科首页   官方微博 | 高级检索  
     

基于多智能体强化学习的新强化函数设计
引用本文:左国玉,张红卫,韩光胜.基于多智能体强化学习的新强化函数设计[J].控制工程,2009,16(2).
作者姓名:左国玉  张红卫  韩光胜
作者单位:北京工业大学,电子信息与控制工程学院,北京,100022
基金项目:北京市教委科技重点发展基金,北京工业大学博士科研启动基金 
摘    要:为了提高强化学习算法在多智能体系统中的性能表现,针对典型的多智能体系统一Keepaway平台总是以失败告终的特点,受与之有相同特点的单智能体系统杆平衡系统所采用强化函数的启发,重新设计一种新的惩罚式的强化函数.新的强化函数在系统成功状态时设零值奖赏,失败状态时给与负值惩罚.基于新设计的强化函数的Sarsa(A)算法成功应用在Keepaway平台上.仿真结果表明,新设计的强化函数在一定参数条件下有效提高了强化学习算法栽Keepaway平台的性能表现.其最终的学习效果更好.

关 键 词:多智能体系统  强化学习  强化函数

A Reward Function Based on Reinforcement Learning of Multi-agent
ZUO Guo-yu,ZHANG Hong-wei,HAN Guang-sheng.A Reward Function Based on Reinforcement Learning of Multi-agent[J].Control Engineering of China,2009,16(2).
Authors:ZUO Guo-yu  ZHANG Hong-wei  HAN Guang-sheng
Affiliation:College of Electronic Information and Control Engineering;Beijing University of Technology;Beijing 100022;China
Abstract:
Keywords:Keepaway  Robocup
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号