首页 | 本学科首页   官方微博 | 高级检索  
     

Robocup半场防守中的一种强化学习算法
引用本文:冯林,李琛,孙焘. Robocup半场防守中的一种强化学习算法[J]. 微机发展, 2008, 0(1)
作者姓名:冯林  李琛  孙焘
作者单位:大连理工大学,大连理工大学,大连理工大学 辽宁大连116024,辽宁大连116024,海军91439部队,辽宁大连116041,辽宁大连116024
基金项目:国家自然科学基金(50575031)
摘    要:Robocup仿真比赛是研究多Agent之间协作和对抗理论的优秀平台,提高Agent的防守能力是一个具有挑战性的问题。为制定合理的防守策略,将Robocup比赛中的一个子任务——半场防守任务分解为多个一对一防守任务,采用了基于Markov对策的强化学习方法解决这种零和交互问题,给出了具体的学习算法。将该算法应用到3D仿真球队——大连理工大学梦之翼(Fantasia)球队,在实际比赛过程中取得了良好效果。验证了采用Markov零和对策的强化学习算法在一对一防守中优于手工代码的结论。

关 键 词:Robocup  强化学习  Markov对策  零和对策

A Reinforcement Learning Method for Robocup Soccer Half Field Defense
FENG Lin,LI Chen,,SUN Tao. A Reinforcement Learning Method for Robocup Soccer Half Field Defense[J]. Microcomputer Development, 2008, 0(1)
Authors:FENG Lin  LI Chen    SUN Tao
Affiliation:FENG Lin1,LI Chen1,2,SUN Tao1
Abstract:
Keywords:Robocup  reinforcement learning  Markov game  zero-sum game
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号