Robocup半场防守中的一种强化学习算法 A Reinforcement Learning Method for Robocup Soccer Half Field Defense期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

Robocup半场防守中的一种强化学习算法

引用本文：	冯林,李琛,孙焘. Robocup半场防守中的一种强化学习算法[J]. 微机发展, 2008, 0(1)

作者姓名：	冯林李琛孙焘

作者单位：	大连理工大学，大连理工大学，大连理工大学辽宁大连116024，辽宁大连116024，海军91439部队，辽宁大连116041，辽宁大连116024

基金项目：	国家自然科学基金(50575031)

摘要：	Robocup仿真比赛是研究多Agent之间协作和对抗理论的优秀平台,提高Agent的防守能力是一个具有挑战性的问题。为制定合理的防守策略,将Robocup比赛中的一个子任务——半场防守任务分解为多个一对一防守任务,采用了基于Markov对策的强化学习方法解决这种零和交互问题,给出了具体的学习算法。将该算法应用到3D仿真球队——大连理工大学梦之翼(Fantasia)球队,在实际比赛过程中取得了良好效果。验证了采用Markov零和对策的强化学习算法在一对一防守中优于手工代码的结论。
关键词：	Robocup 强化学习 Markov对策零和对策
A Reinforcement Learning Method for Robocup Soccer Half Field Defense

FENG Lin,LI Chen,,SUN Tao. A Reinforcement Learning Method for Robocup Soccer Half Field Defense[J]. Microcomputer Development, 2008, 0(1)

Authors:	FENG Lin LI Chen SUN Tao

Affiliation:	FENG Lin1,LI Chen1,2,SUN Tao1

Abstract:

Keywords:	Robocup reinforcement learning Markov game zero-sum game
本文献已被 CNKI 等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏