首页 | 本学科首页   官方微博 | 高级检索  
     

基于局部合作的RoboCup多智能体Q-学习
作者姓名:刘亮  李龙澍
作者单位:安徽大学计算智能与信号处理教育部重点实验室,合肥,230039;安徽大学计算智能与信号处理教育部重点实验室,合肥,230039
基金项目:国家自然科学基金,安徽省高校学科拔尖人才基金 
摘    要:针对多智能体Q-学习中存在的联合动作指数级增长问题,采用-种局部合作的Q-学习方法,在智能体之间有协作时才考察联合动作,否则只进行简单的个体智能体的Q-学习,从而减少学习时所要考察的状态-动作对值。在机器人足球仿真2D平台上进行的实验表明,该方法比常用多智能体强化学习技术具有更高的效率。

关 键 词:马尔可夫决策  Q-学习  局部合作  仿真2D
修稿时间: 
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号