共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
多智能体深度强化学习(MADRL)将深度强化学习的思想和算法应用到多智能体系统的学习和控制中,是开发具有群智能体的多智能体系统的重要方法.现有的MADRL研究主要基于环境完全可观测或通信资源不受限的假设展开算法设计,然而部分可观测性是多智能体系统实际应用中客观存在的问题,例如智能体的观测范围通常是有限的,可观测的范围外不包括完整的环境信息,从而对多智能体间协同造成困难.鉴于此,针对实际场景中的部分可观测问题,基于集中式训练分布式执行的范式,将深度强化学习算法Actor-Critic扩展到多智能体系统,并增加智能体间的通信信道和门控机制,提出recurrent gated multi-agent Actor-Critic算法(RGMAAC).智能体可以基于历史动作观测记忆序列进行高效的通信交流,最终利用局部观测、历史观测记忆序列以及通过通信信道显式地由其他智能体共享的观察进行行为决策;同时,基于多智能体粒子环境设计多智能体同步且快速到达目标点任务,并分别设计2种奖励值函数和任务场景.实验结果表明,当任务场景中明确出现部分可观测问题时,RGMAAC算法训练后的智能体具有很好的表现,在稳定性... 相似文献
3.
本文研究了一类多智能体系统在牵制控制下的群一致性问题,提出了融合群内信息交互、群间信息交互和牵制控制器的一致性协议.对固定拓扑下的二群组智能体系统和切换拓扑下的多群组智能体系统,利用稳定性理论和图论分别给出了适用于任意拓扑结构的充要条件,使得智能体系统在所提协议和牵制控制器的联合作用下实现预期的群一致.针对拓扑图中含有生成树这一特例,分析了被施加牵制控制的智能体在结构中的具体位置.此外,对切换拓扑下进行非线性交互的多群组智能体系统,利用Lyapunov方法推导出一充分条件,得出只要对多智能体系统的一部分主体进行牵制控制,则所有智能体即可在所提协议和牵制控制器的作用下渐近收敛于各自的期望一致平衡点.最后,仿真例子验证了所提方法的有效性. 相似文献
4.
一种基于分布式强化学习的多智能体协调方法 总被引:2,自引:0,他引:2
多智能体系统研究的重点在于使功能独立的智能体通过协商、协调和协作,完成复杂的控制任务或解决复杂的问题。通过对分布式强化学习算法的研究和分析,提出了一种多智能体协调方法,协调级将复杂的系统任务进行分解,协调智能体利用中央强化学习进行子任务的分配,行为级中的任务智能体接受各自的子任务,利用独立强化学习分别选择有效的行为,协作完成系统任务。通过在Robot Soccer仿真比赛中的应用和实验,说明了基于分布式强化学习的多智能体协调方法的效果优于传统的强化学习。 相似文献
5.
6.
传统的群决策支持系统存在着群体决策活动协调力度差、数据共享困难等缺陷,不能很好的支持Web下的群体决策活动。文中在分析多智能体和数据仓库概念的基础上,提出了一个基于多智能体和数据仓库的群体决策支持系统,利用数据仓库和智能体技术解决了群体决策支持系统中的信息集成和分布式问题求解问题,并对基于智能体的群决策过程进行了研究。 相似文献
7.
多智能体技术通过各自治智能体间的通讯、协调、合作来表达实际的复杂系统,特别适用于城市交通系统的建模。在分析了多智能体技术和城市交通系统特性的基础上,对多智能体在城市交通管理系统、出行信息系统和公交系统中的应用现状进行了综合论述,对各个领域最具代表性的应用进行了介绍和分析。研究认为,多智能体技术为城市交通问题提供了良好的解决方案,在具体应用中需要对交通环境和实体进行准确的建模,缓解通信需求、降低运算量及低协调复杂度、增强应用系统的稳定性和安全性。最后指出了多智能体技术在城市交通系统应用中的发展趋势。 相似文献
8.
9.
多智能体系统MAS及其应用 总被引:1,自引:3,他引:1
分布式人工智能的研究和网络化分布环境的普及,推动了Agent的理论、技术特别是多Agent的理论及其技术的进展.随着计算机科学的发展迅速趋于成熟,多智能体方法和技术在很多领域得到了广泛的应用.针对目前多智能体系统(MAS)的研究现状及存在的问题,运用系统工程的思想,给出了多智能体系统的研究思路与方法.从工程应用的角度出发,详细论述了Agent及MAS的特性、结构模型以及多智能体系统所使用的一种最常用的通讯语言--KQML,重点分析了多智能体技术在几个有代表性领域的应用.最后,对多智能体系统技术的应用前景做出了系统的分析与展望. 相似文献
10.
多智能体车间调度系统研究 总被引:1,自引:0,他引:1
郑旭栋 《自动化与仪器仪表》2007,(3):30-31,61
现在制造业所面临的动态需求使得其必须具有更加灵活的应变机制,这使得车间调度问题变得越来越复杂。本文采取多智能体系统技术(MAS)设计了一个包含四个智能体(agent)的多智能体车间调度系统,分别为车间调度智能体、任务分配智能体、车间资源智能体以及拍卖智能体。通过这四个智能体的通信、交互和合作,系统可以给出一个满足当前制造需求的调度最优结果。 相似文献
11.
基于Petri Net的多Agent系统建模 总被引:2,自引:0,他引:2
多Agent系统是近年来分布式人工智能的一个研究热点。随着对其研究的深入和应用的推广,急需一种建模技术对其进行形式化描述。针对这个问题,该文提出了一种使用PetriNet形式化表示多Agent系统的方法,分别从单个Agent视图和整个Agent系统的全局视图对其加以描述,以便进一步的分析和评估。 相似文献
12.
多Agent协作求解是分布式人工智能要研究的基本问题。该文基于管理agent概念提出一个新的协作模型,该模型利用管理Agent对多Agent系统进行全局协作分配,协作申请分级处理,解决了传统协作模型中存在的模型与应用领域有关和只适用于静态环境的问题。 相似文献
13.
This paper describes a multi-agent system (MAS) for automatic publication of information in both printed and electronic media. The main objective is to have a document ready to be displayed (and printed) at every stage of the workflow. This is accomplished by replacing the traditional human role of page editing by a multi-agent system composed of three different agent roles (section, page and element). Key aspects such as page aesthetics or readability are handled by using artificial intelligence techniques such as neural networks, genetic algorithms and fuzzy logic. The theoretical foundations of this system are discussed and an example of implementation using an external toolkit is described. 相似文献
14.
15.
多Agent系统是人工智能、软件领域等研完的热点问题,在这个问题的研究中,人们普遍关注的问题是如何组织协调Agent之间的关系,让各个Agent充分发挥作用,使系统处于最佳状态,本文抓住多Agent之间的这个关键问题。给出了多Agent系统的排队模型的基本概念,为进一步研完多Agent系统奠定了理论基础。 相似文献
16.
In this paper, a novel ambient intelligence (AmI) platform is proposed to facilitate fast integration of different control algorithms, device networks and user interfaces. This platform defines the overall hardware/software architecture and communication standards. It consists of four layers, namely the ubiquitous environment, middleware, multi-agent system and application layer. The multi-agent system is implemented using Java Agent DEvelopment (JADE) framework and allows users to incorporate multiple control algorithms as agents for managing different tasks. The Universal Plug and Play (UPnP) device discovery protocol is used as a middleware, which isolates the multi-agent system and physical ubiquitous environment while providing a standard communication channel between the two. An XML content language has been designed to provide standard communication between various user interfaces and the multi-agent system. A mobile ubiquitous setup box is designed to allow fast construction of ubiquitous environments in any physical space. The real time performance analysis shows the potential of the proposed AmI platform to be used in real-life AmI applications. A case study has also been carried out to demonstrate the possibility of integrating multiple control algorithms in the multi-agent system and achieving a significant improvement on the overall offline learning performance. 相似文献
17.
多Agent系统是人工智能、软件领域等研究的热点问题,在这个问题的研究中,人们普遍关注的问题是如何组织协调Agent之间的关系,让各个Agent充分发挥作用,使系统处于最佳状态。本文抓住多Agent之间的这个关键问题,给出了多Agent系统的排队模型的基本概念,为进一步研究多Agent系统奠定了理论基础。 相似文献
18.
19.
业务流程模型是企业、政府等组织建模的核心.针对目前业务流程执行的线性性、模型的柔性、智能性不足,和角色缺乏动态性和主动性的弊端,在分析了RN(角色网络)模型的基础上,模型中引入了多Agent,并用这些Agent之间的交流协作来描述业务流程;提出了RN理论支持的多Agent协同业务流程模型,使得执行者Agent成为模型的... 相似文献
20.
集群机器人系统特性评价研究综述 总被引:1,自引:1,他引:0
集群机器人系统是群体智能的一个重要应用研究领域, 也是机器人系统未来发展的重要方向之一. 集群机器人系统特性评价是一个极具挑战性的关键技术与理论问题, 对于集群机器人系统的研究与发展具有重要意义. 首先, 给出了对集群机器人系统基本概念的理解, 并且从多种不同角度作出了分类. 其次, 梳理了多个关键的集群机器人系统期望特性; 在此基础上, 分别从评价标准、评价指标体系和评价方法三方面对已有集群机器人系统特性评价研究成果进行了比较全面的评述. 最后, 分析总结了当前集群机器人系统特性评价研究工作的不足, 并对未来发展方向进行了展望. 相似文献