基于局部合作的RoboCup多智能体Q-学习 |
| |
作者姓名: | 刘亮 李龙澍 |
| |
作者单位: | 安徽大学计算智能与信号处理教育部重点实验室,合肥,230039;安徽大学计算智能与信号处理教育部重点实验室,合肥,230039 |
| |
基金项目: | 国家自然科学基金,安徽省高校学科拔尖人才基金 |
| |
摘 要: | 针对多智能体Q-学习中存在的联合动作指数级增长问题,采用-种局部合作的Q-学习方法,在智能体之间有协作时才考察联合动作,否则只进行简单的个体智能体的Q-学习,从而减少学习时所要考察的状态-动作对值。在机器人足球仿真2D平台上进行的实验表明,该方法比常用多智能体强化学习技术具有更高的效率。
|
关 键 词: | 马尔可夫决策 Q-学习 局部合作 仿真2D |
修稿时间: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程》浏览原始摘要信息 |
|
点击此处可从《计算机工程》下载全文 |
|