首页 | 本学科首页   官方微博 | 高级检索  
     

基于半自治agent的Profit-sharing增强学习方法研究
引用本文:杨克巍,张少丁,岑凯辉,谭跃进. 基于半自治agent的Profit-sharing增强学习方法研究[J]. 计算机工程与应用, 2007, 43(15): 72-75
作者姓名:杨克巍  张少丁  岑凯辉  谭跃进
作者单位:国防科技大学,信息系统与管理学院,长沙,410073;国防科技大学,信息系统与管理学院,长沙,410073;国防科技大学,信息系统与管理学院,长沙,410073;国防科技大学,信息系统与管理学院,长沙,410073
摘    要:在基于半自治agent的系统中应用profit-sharing增强学习方法,并与基于动态规划的Q-learning 增强学习方法进行比较,在不确定因素较多的动态环境中,当系统状态变化不是一个马尔科夫过程时profit-sharing方法具有很大优势。根据半自治agent中半自治的特性——受制性,提出了一种面向基于半自治agent的增强学习模型,以战场仿真中安全隐蔽的寻找模型为实例对基于半自治agent的profit-sharing增强学习模型进行了试验分析。

关 键 词:增强学习  半自治agent  profit-sharing  Q-learning
文章编号:1002-8331(2007)15-0072-04
修稿时间:2006-08-01

Research of profit-sharing reinforcement learning method based on semi-autonomous agent
YANG Ke-wei,ZHANG Shao-ding,CEN Kai-hui,TAN Yue-jin. Research of profit-sharing reinforcement learning method based on semi-autonomous agent[J]. Computer Engineering and Applications, 2007, 43(15): 72-75
Authors:YANG Ke-wei  ZHANG Shao-ding  CEN Kai-hui  TAN Yue-jin
Affiliation:School of Information and Management,National University of Defense Technology,Changsha 410073,China
Abstract:We exert the profit-sharing reinforcement learning method into the semi-autonomous agent system,and compare it with the other reinforce learning method--Q-learning.Profit-sharing method is more robust and fit for the dynamic environment which includes many uncertain factors,especially in the partial MDPs(Markov Decision Processes) environment.Facing the semi -autonomous property of the agent,we propose an improving learning method of profit-sharing in the semi-autonomous agent system and test it in a combat simulation environment that finds the safety hidden space in battlefield.At last we contract and analyze these methods to the others.
Keywords:reinforcement learning  semi-autonomous agent  profit-sharing  Q-learning
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号