首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
研究了多Agent环境下的协作与学习.对多Agent系统中的协作问题提出了协作模型MACM,该模型通过提供灵活协调机制支持多Agent之间的协作及协作过程中的学习.系统中的学习Agent采用分布式强化学习算法.该算法通过映射减少Q值表的存储空间,降低对系统资源的要求,同时能够保证收敛到最优解.  相似文献   

2.
分析了饲料配方问题现有的求解策略,在Bruin提出的多Agent协商求解一种简化线性规划问题的理论模型的基础上,利用多Agent协商理论和线性规划理论,建立了Agent模型,提出了基于多Agent协商策略的饲料配方问题求解的优化算法,并证明了算法的正确性和可行性。实验结果表明,该算法具有更强的求解能力。  相似文献   

3.
一种基于多Agent的进化多目标优化算法   总被引:1,自引:0,他引:1  
将进化多Agent系统引入多目标优化问题求解,通过Agent的局部搜索机制及Agent种群的协同进化机制来寻求Pareto最优解。在设计的进化算法当中借鉴了人工生命系统中的一些基本方法,如能量、小生境和迁移机制等。实例表明通过该进化算法求得Pareto最优解集具有很高的效率。  相似文献   

4.
针对随机需求下供应链产销订购冲突问题,考虑一个制造商和两个零售商组成的两级供应链,构建主从博弈下的多Agent协商模型。制造商作为博弈主方制定批发价,零售商作为从方选择最优订货量和零售价,制造商Agent和零售商Agent自动协商,运用模拟退火算法寻求模型的最优解。通过算例发现合理的让步策略和收益共享契约能够提高供应链系统利润,实现产销双方的互利共赢。验证模拟退火算法求解该模型比遗传算法能够得到更优解。  相似文献   

5.
Agent技术特别是多Agent系统(MAS,Multi-Agent System)为解决人工智能等领域复杂问题提供了一个新途径,多Agent系统重点研究如何协调系统中的各个Agent的行为使其协同工作.针对多阶段组合投资问题,提出了一个基于多Agent系统的自调节及协同工作的组合投资策略模型.该模型系统中的各个Agent通过通讯共享知识,在求解问题的搜索空间中进行协同搜索,在更短的搜索步长内得到问题的解,极大地提高了系统性能.该模型具有不基于任何股票模型、时间复杂度低以及逼近最优投资策略速度较快等优点,实验证明具有一定的实际意义.  相似文献   

6.
针对细菌群体趋药性(Bacterial Colony Chemotaxis,BCC)算法由于过度依赖群体交互而容易陷入局部最优解的缺陷,结合多Agent系统(Multi-Agent System,MAS)的主要特征构造一种全新算法——基于多Agent的细菌群体趋药性(MABCC)算法。该算法通过每个细菌Agent相互之间的竞争与协作,弱化其对群体信息的依赖,使其能够更精确地收敛到全局最优解。对不同函数优化试例的仿真表明该算法比BCC算法有更好的全局寻优性能。  相似文献   

7.
一种劝说式多Agent多议题协商方法   总被引:9,自引:0,他引:9  
多Agent系统中的协商问题往往由许多议题组成,导致问题空间十分庞大.传统的协商方法通过对问题空间进行穷尽搜索来找到最优解,并不适合多议题协商.而且,传统的方法不考虑协商偏好变化的情况,使得Agent在不完全及不正确环境下找到的最优解并不合理.提出一种劝说式多Agent多议题协商方法.借助信念修正这一有效的推理工具,协商Agent能够在协商过程中接受协商对手的劝说,考虑对手对协商议题的偏好,并根据一种基于辩论的信念修正方法调整自身的偏好.这样就能够使协商Agent对变化的协商环境具备适应性,从而提高协商的效率及正确率,快速准确地达成协议.  相似文献   

8.
多Agent强化学习算法的研究一直以来大多都是针对于合作策略,而NashQ算法的提出对非合作策略的研究无疑是一个重要贡献。针对在多Agent系统中,Nash平衡无法确保求得的解是Paret。最优解及其计算复杂度较高的问题,提出了基于Mcta平衡的MctaQ算法。与NashQ算法不同,MctaQ算法通过对自身行为的预处理以及对其它Agent行为的预测来获取共同行为的最优策略。最后通过研究及气候合作策略游戏实验,证明了MctaQ算法在解决非合作策略的问题中有着很好的理论解释和实验性能。  相似文献   

9.
自适应粒子群算法求解Agent联盟   总被引:8,自引:0,他引:8  
联盟生成是多Agent系统的一个关键问题,主要研究如何在多Agent系统中动态生成面向任务的最优Agent联盟.引入粒子群算法来解决这一问题,受到惯性权重c0在进化过程中所起作用的启发,引入自适应惯性权重cadp对粒子群算法进行改进,使其不再易于陷入局部极小.对比实验结果表明,该算法在解的性能和收敛速度上均优于相关算法.  相似文献   

10.
多Agent协作追捕问题是多Agent协调与协作研究中的一个典型问题。针对具有学习能力的单逃跑者追捕问题,提出了一种基于博弈论及Q学习的多Agent协作追捕算法。首先,建立协作追捕团队,并构建协作追捕的博弈模型;其次,通过对逃跑者策略选择的学习,建立逃跑者有限的Step-T累积奖赏的运动轨迹,并把运动轨迹调整到追捕者的策略集中;最后,求解协作追捕博弈得到Nash均衡解,每个Agent执行均衡策略完成追捕任务。同时,针对在求解中可能存在多个均衡解的问题,加入了虚拟行动行为选择算法来选择最优的均衡策略。C#仿真实验表明,所提算法能够有效地解决障碍环境中单个具有学习能力的逃跑者的追捕问题,实验数据对比分析表明该算法在同等条件下的追捕效率要优于纯博弈或纯学习的追捕算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号