首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
一种具有自主学习能力的并发协商模型   总被引:3,自引:0,他引:3  
张谦  邱玉辉 《计算机应用》2006,26(3):663-0665
提出一种具有自主学习能力的并发协商模型,通过使用增强学习方法的Q学习算法生成协商提议,使用相似度方法评价提议,使得Agent能够在半竞争、信息不完全和不确定以及存在最大协商时间的情况下,更为有效地完成多议题多Agent并发协商。  相似文献   

2.
秦子鹰  周南  赵冬梅 《微计算机信息》2007,23(24):137-138,88
该文提出了一个针对轿车市场中交易协商的双边多议题自动协商模型,该模型具有如下特点:用基于效用的相似度比较法实现Agent智能搜索;模型采用学习机制包括历史学习和Q-学习,历史学习机制用于Agent协商前初始信念的创建,对Agent在协商中策略的选择、执行具有指导作用。Q-学习机制用于生成协商提议,使得Agent能够在半竞争、信息不完全和不确定以及存在最大协商时间的情况下,更为有效地完成多议题协商。  相似文献   

3.
一种基于时间-效用的Agent社会承诺机制   总被引:1,自引:0,他引:1  
在多Agent系统中,为了完成任务,Agent之间需要建立社会承诺。本文通过将T.Sandholm的分级承诺合同协议思想与时间-效用对协商的影响有机地结合起来,提出了一种基于时间-效用的Agent社会承诺机制,为电子商务环境下存在最大协商时间的一对多协商中的买卖双方Agent之间的社会承诺问题提供了有效的解决方案。文章分析了解除承诺的条件,提出了建立承诺、解除承诺和遵守承诺的规则,从而有效规避了协商中买方Agent与卖方Agent随意达成一致的行为,同时保证了买方Agent能够在最大协商时间内确定最佳交易卖方,从而提高了协商系统的效率和效用。  相似文献   

4.
多属性之间的依赖关系增加协商Agent效用函数的复杂性,从而也增加多属性协商问题的复杂度.本文提出一种基于GAI多属性依赖的协商模型.该模型使用GAI分解将协商Agent的非线性效用函数表示为依赖属性子集的子效用之和.在协商过程中,协商双方采用不同的让步策略和提议策略来改变提议的内容.卖方Agent利用本文提出的GAI网合并算法将协商双方的GAI网合并,并利用生成的GAI树产生使社会福利评估值最大的提议.实验表明当买方Agent采用局部让步策略且卖方Agent采用全局让步策略时,协商双方能够在有限的协商步内达到接近Pareto最优的协商结局.  相似文献   

5.
在利用多Agent构建人工系统的过程中,Agent的利益偏好不同及资源有限等因素会引起冲突,而多Agent之间有效的协商竞争能够减少冲突,提高整体性能。为此,提出一种新的多Agent协商竞争模型,该模型依托协商信息,提高竞争对手策略预测准确率,同时采用概率最大化利益行为选择策略,从而缩短协商竞争时间。  相似文献   

6.
基于学习的多Agent多议题协商优化研究   总被引:1,自引:0,他引:1  
以买方Agent的观点,对从交易平台上获得的卖方Agent的历史协商信息进行分析,并根据其特点做初步过滤。在此基础上,针对现有协商模型中存在的问题,提出了一个Agent协商对手选择算法和相应的交互机制,并验证了其可行性。该算法可用于Agent协商开始前协商对手的选择和初始信念的更新,对Agent在协商中策略的选择和执行具有指导作用,能有效提高Agent在协商中的效用及效率。  相似文献   

7.
利用多Agent系统具有的自治性和实时反应性,探讨对抗环境下的多Agent协商决策问题,提出一种混合式的多Agent结构协商模型,给出以最大团队效益为前提的协商求解策略和协商角色交换算法。通过协商,对抗环境中的Agent成员能够很好地进行动作策略选择和移动,能更好地进行进攻和防守。仿真实验验证了算法的可行性和有效性,结果表明其在一定程度上解决了多Agent系统中实时动态和受限通信对抗环境下的多Agent决策与合作问题。  相似文献   

8.
重点研究了一对多协商中对多个并发的一对一协商进行协调的协调策略。首先提出了相对效用理论,接着提出了基于相时效用理论的一对多协商协调策略,谊策略能够很好地解决当多个并发协商进程同时获得满足艘用评估的提议,特别是存在多个最大相同效用提议时的取舍问题,为协商更加有效、健壮、有序地执行提供了坚实的基础。  相似文献   

9.
基于增强学习协商策略的研究及优化   总被引:1,自引:0,他引:1  
增强学习在电子商务中可以帮助Agent选择最优行动,并达成目标。在传统增强学习协商策略中,Agent一开始便进行大幅度的妥协,这是不合理的,与现实不符,降低了Agent的期望。通过期望还原率来还原Agent的真实期望,对协商策略进行优化;讨论了期望还原率的取值对协商过程的影响;通过实验验证了优化的协商策略在保证协商效率的同时,提高了协商解的质量。  相似文献   

10.
一种劝说式多Agent多议题协商方法   总被引:9,自引:0,他引:9  
多Agent系统中的协商问题往往由许多议题组成,导致问题空间十分庞大.传统的协商方法通过对问题空间进行穷尽搜索来找到最优解,并不适合多议题协商.而且,传统的方法不考虑协商偏好变化的情况,使得Agent在不完全及不正确环境下找到的最优解并不合理.提出一种劝说式多Agent多议题协商方法.借助信念修正这一有效的推理工具,协商Agent能够在协商过程中接受协商对手的劝说,考虑对手对协商议题的偏好,并根据一种基于辩论的信念修正方法调整自身的偏好.这样就能够使协商Agent对变化的协商环境具备适应性,从而提高协商的效率及正确率,快速准确地达成协议.  相似文献   

11.
自2001年Jennings研究协商以来,已经成为MAS研究的热点。介绍了协商的定义、研究内容、应用领域;分析了协商的复杂性;总结了通用的单议题协商和多议题协商协议的对策论模型;综述了Agent多议题协商的策略与学习算法;并分别介绍了两种典型的多议题协商:拍卖和并发协商,给出组合拍卖、多属性拍卖和并发协商的基本模型及其研究进展;最后探讨了协商存在问题和将来可能的发展方向,指出作为交互、竞争与合作的基础,协商需要继续深入的探讨,也必将成为多Agent系统研究的主流。  相似文献   

12.
基于Q-强化学习的多Agent协商策略及算法   总被引:1,自引:1,他引:0       下载免费PDF全文
隋新  蔡国永  史磊 《计算机工程》2010,36(17):198-200
针对传统Agent协商策略学习能力不足,不能满足现代电子商务环境需要的问题,采用Q-强化学习理论对Agent的双边协商策略加以改进,提出基于Q-强化学习的Agent双边协商策略,并设计实现该策略的算法。通过与时间协商策略比较,证明改进后的Agent协商策略在协商时间、算法效率上优于未经学习的时间策略,能够增强电子商务系统的在线学习能力,缩短协商时间,提高协商效率。  相似文献   

13.
基于agent的两阶段式一对多谈判模型研究   总被引:3,自引:0,他引:3  
提出了一种两阶段式一对多谈判模型。与多个一对一并行谈判模式相比,它可以更好地体现一对多谈判的特点,即加强了多个卖方之间的竞争关系和单个买方的主导地位,使得单个买方有机会获得更优报价,也使其他卖家不会因为采取了竞争力较小的策略而丧失谈判机会。模型中提出了暂时接受报价的概念,即令其等于买方接收到的第一阶段最后一轮最小报价或第二阶段每轮最小报价,并利用此值计算卖方下一轮的报价,从而利用上一轮最低报价压低下一轮报价,达到多方竞争的目的。  相似文献   

14.
增强学习可以帮助协商Agent选择最优行动实现其最终目标。对基于增强学习的协商策略进行优化,在协商过程中充分利用对手的历史信息,加快协商解的收敛和提高协商解的质量。最后通过实验验证了算法的有效性和可用性。  相似文献   

15.
随着在线交易的越来越普遍,电子商务己成为当前一种重要的商务方式。在商务活动中,买卖双方在交易时必然会因商品属性的要求不同而发生争议,这时一般采用协商、谈判方式来达成共识。为了达到这种共识提出了多Agent的协商与谈判的技术。首先对限时条件下的两方多议题协商提出了多回合协商框架,其次探讨了时间约束下的谈判策略。  相似文献   

16.
针对现有协商策略机制在处理动态议题方面的不足,提出了一种新的提议生成策略机制。一方面,该机制通过对现有机制的重新整合简化了META策略的设计;另一方面,对新机制中引入的折中算法进行改进,使之有效适应了协商过程中的议题动态变化。实验表明,该策略机制在议题动态变化时既保证了协商成功时间,又保证了协商双方联合效用,在议题动态性方面表现了良好的适应能力。  相似文献   

17.
协商是人们就某些议题进行交流寻求一致协议的过程.而自动协商旨在通过协商智能体的使用降低协商成本、提高协商效率并且优化协商结果.近年来深度强化学习技术开始被运用于自动协商领域并取得了良好的效果,然而依然存在智能体训练时间较长、特定协商领域依赖、协商信息利用不充分等问题.为此,本文提出了一种基于TD3深度强化学习算法的协商策略,通过预训练降低训练过程的探索成本,通过优化状态和动作定义提高协商策略的鲁棒性从而适应不同的协商场景,通过多头语义神经网络和对手偏好预测模块充分利用协商的交互信息.实验结果表明,该策略在不同协商环境下都可以很好地完成协商任务.  相似文献   

18.
This paper describes a negotiation model that incorporates real-time issues for autonomous agents. This model consists of two important ideas: a real-time logical negotiation protocol and a case-based negotiation model. The protocol integrates a real-time Belief-Desire-Intention (BDI) model, a temporal logic model, and communicative acts for negotiation. This protocol explicitly defines the logical and temporal relationships of different knowledge states, facilitating real-time designs such as multi-threaded processing, state profiling and updating, and a set of real-time enabling functional predicates in our implementation. To further support the protocol, we use a case-based reasoning model for negotiation strategy selection. An agent learns from its past experience by deriving a negotiation strategy from the most similar and useful case to its current situation. Guided by the strategy, the agent negotiates with its partners using an argumentation-based negotiation protocol. The model is time and situation aware such that each agent changes its negotiation behavior according to the progress and status of the ongoing negotiation and its current agent profile. We apply the negotiation model to a resource allocation problem and obtain promising results.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号