多任务联盟形成中的Agent行为策略研究 |
| |
作者姓名: | 蒋建国 苏兆品 张国富 夏娜 |
| |
作者单位: | 合肥工业大学,计算机与信息学院,安徽,合肥,230009;安全关键工业测控技术教育部工程研究中心,安徽,合肥,230009 |
| |
基金项目: | 国家自然科学基金,高等学校博士学科点专项科研项目,安徽省自然科学基金 |
| |
摘 要: | Agent联盟是多Agent系统中一种重要的合作方式,联盟形成是其研究的关键问题.本文提出一种串行多任务联盟形成中的Agent行为策略,首先论证了Agent合作求解多任务的过程是一个Markov决策过程,然后基于Q-学习求解单个Agent的最优行为策略.实例表明该策略在面向多任务的领域中可以快速、有效地串行形成多个任务求解联盟.
|
关 键 词: | 串行多任务 联盟 Agent行为策略 Q-学习 |
收稿时间: | 2007-03-23 |
修稿时间: | 2007-12-25 |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《控制理论与应用》浏览原始摘要信息 |
|
点击此处可从《控制理论与应用》下载免费的PDF全文 |
|