基于多智能体强化学习的新强化函数设计 A Reward Function Based on Reinforcement Learning of Multi-agent期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于多智能体强化学习的新强化函数设计

引用本文：	左国玉,张红卫,韩光胜.基于多智能体强化学习的新强化函数设计[J].控制工程,2009,16(2).

作者姓名：	左国玉张红卫韩光胜

作者单位：	北京工业大学,电子信息与控制工程学院,北京,100022

基金项目：	北京市教委科技重点发展基金，北京工业大学博士科研启动基金

摘要：	为了提高强化学习算法在多智能体系统中的性能表现,针对典型的多智能体系统一Keepaway平台总是以失败告终的特点,受与之有相同特点的单智能体系统杆平衡系统所采用强化函数的启发,重新设计一种新的惩罚式的强化函数.新的强化函数在系统成功状态时设零值奖赏,失败状态时给与负值惩罚.基于新设计的强化函数的Sarsa(A)算法成功应用在Keepaway平台上.仿真结果表明,新设计的强化函数在一定参数条件下有效提高了强化学习算法栽Keepaway平台的性能表现.其最终的学习效果更好.
关键词：	多智能体系统强化学习强化函数
A Reward Function Based on Reinforcement Learning of Multi-agent

ZUO Guo-yu,ZHANG Hong-wei,HAN Guang-sheng.A Reward Function Based on Reinforcement Learning of Multi-agent[J].Control Engineering of China,2009,16(2).

Authors:	ZUO Guo-yu ZHANG Hong-wei HAN Guang-sheng

Affiliation:	College of Electronic Information and Control Engineering;Beijing University of Technology;Beijing 100022;China

Abstract:

Keywords:	Keepaway Robocup
本文献已被 CNKI 维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏