首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
为了帮助协商Agent选择最优行动实现其最终目标,提出基于贝叶斯分类的增强学习协商策略。在协商过程中,协商Agent根据对手历史信息,利用贝叶斯分类确定对手类型,并及时动态地调整协商Agent对对手的信念。协商Agen、通过不断修正对对手的信念,来加快协商解的收敛并获得更优的协商解。最后通过实验验证了策略的有效性和可用性。  相似文献   

2.
张科  罗军  邓俊昆 《计算机科学》2014,41(1):290-292
针对传统增强学习算法存在妥协过快导致自身效用降低的缺点,通过设计改进增强学习算法的双边多议题协商模型,引入期望还原率,还原Agent的期望,从而提高协商解的质量。通过实验分析了期望还原率不同取值对协商的影响,并对传统增强学习协商策略、基于时间的协商策略和改进增强学习协商策略的协商效果做了对比。实验表明,在协商次数允许的范围之内,基于期望还原率的改进增强学习算法在双边多议题协商中能够提升双方的效用。  相似文献   

3.
基于增强学习协商策略的研究及优化   总被引:1,自引:0,他引:1  
增强学习在电子商务中可以帮助Agent选择最优行动,并达成目标。在传统增强学习协商策略中,Agent一开始便进行大幅度的妥协,这是不合理的,与现实不符,降低了Agent的期望。通过期望还原率来还原Agent的真实期望,对协商策略进行优化;讨论了期望还原率的取值对协商过程的影响;通过实验验证了优化的协商策略在保证协商效率的同时,提高了协商解的质量。  相似文献   

4.
一种具有自主学习能力的并发协商模型   总被引:3,自引:0,他引:3  
张谦  邱玉辉 《计算机应用》2006,26(3):663-0665
提出一种具有自主学习能力的并发协商模型,通过使用增强学习方法的Q学习算法生成协商提议,使用相似度方法评价提议,使得Agent能够在半竞争、信息不完全和不确定以及存在最大协商时间的情况下,更为有效地完成多议题多Agent并发协商。  相似文献   

5.
基于Q-强化学习的多Agent协商策略及算法   总被引:1,自引:1,他引:0       下载免费PDF全文
隋新  蔡国永  史磊 《计算机工程》2010,36(17):198-200
针对传统Agent协商策略学习能力不足,不能满足现代电子商务环境需要的问题,采用Q-强化学习理论对Agent的双边协商策略加以改进,提出基于Q-强化学习的Agent双边协商策略,并设计实现该策略的算法。通过与时间协商策略比较,证明改进后的Agent协商策略在协商时间、算法效率上优于未经学习的时间策略,能够增强电子商务系统的在线学习能力,缩短协商时间,提高协商效率。  相似文献   

6.
AODE是我们研制的一个面向agent的智能系统开发环境,本文以AODE为平台研究了多agent环境下的协商与学习本文利用协商-协商过程-协商线程的概念建立了多边-多问题协商模型MMN,该协商模型支持多agent环境中的多种协商形式及agent在协商过程中的学习,系统中的学习agent采用状态概率聚类空间上的多agent强化学习算法.该算法通过使用状态聚类方法减少Q值表存储所需空间,降低了经典Q-学习算法由于使用Q值表导致的对系统计算资源的要求,且该算法仍然可以保证收敛到最优解.  相似文献   

7.
王黎明  沈扬 《计算机应用》2010,30(6):1519-1522
针对多议题协商中的僵局问题,提出了一个基于议题权值的优化策略。利用学习机制预测对手议题权值,并考虑多议题协商中各议题之间的相关性,在保证协商参与者利益的前提下,根据议题的权值,有针对性地调整议题预保留值的取值,从而能够打破僵局,并快速消解协商僵局,促使协商双方得到合理协商解,使得协商效率大大提高。  相似文献   

8.
一个基于多阶段的多Agent多问题协商框架   总被引:8,自引:0,他引:8  
多问题协商是电子交易中的关键问题.多Agent技术的不断成熟为这个问题的解决提供了有效的途径.提出了一个以理性Agent为基础的基于多阶段的多问题协商框架,该框架在时间约束下适用于信息不完全的场景,它描述了多问题的价格协商.为了降低多问题协商的复杂性,它将多问题协商分解为多阶段协商,每个阶段的大小(问题数)相同.阶段数和顺序在协商前确定,每个阶段中的问题顺序在协商中确定.在阶段大小相同的情况下,对给定协商问题的分解,框架能给出优化协商议程(agenda).尤其是框架能为参与协商的Agent建立学习系统(LS),以增强Agent的学习能力.最后基于这个框架实现了一个原型系统,原型系统证明这个框架是有效的.  相似文献   

9.
为了解决多Agent系统(MAS)协商双方在信息对称情况下的自动协商问题,提出了一种用基于支持向量机算法的间接学习对手协商态度的协商方法,提出了不完全信息条件下基于案例和对策论的Agent多议题Pareto最优协商模型,通过支持向量机的方法来学习协商轨迹,得到协商对手在每个协商项的态度,然后利用学习得到的对手协商态度,构造了一个协商的决策模型,此模型能同时基于对手的态度和自身的偏好来做出协商决策。最后通过实验验证了该方法的先进性。  相似文献   

10.
基于神经网络的协商学习机制   总被引:1,自引:0,他引:1  
卢刚  倪宁  郭庆 《计算机工程与应用》2005,41(13):51-53,132
多agent协商研究中,如何通过学习提高协商效率是一个重要的课题,目前的研究多采用简单的学习算法,学习效果不好。论文首先提出了一个两方多回合交互协商框架,然后依据协商历史结果、协商双方初次出价等信知,对协商结果信息进行预测,从而确定协商交互中的推理策略,并利用BP神经网络的自适应、自学习能力对协商结果预测机制进行学习。随后的验证系统表明,该机制通过对协商结果的有效预测,提高了协商交互的效率和协商个体的效用。  相似文献   

11.
协商是人们就某些议题进行交流寻求一致协议的过程.而自动协商旨在通过协商智能体的使用降低协商成本、提高协商效率并且优化协商结果.近年来深度强化学习技术开始被运用于自动协商领域并取得了良好的效果,然而依然存在智能体训练时间较长、特定协商领域依赖、协商信息利用不充分等问题.为此,本文提出了一种基于TD3深度强化学习算法的协商策略,通过预训练降低训练过程的探索成本,通过优化状态和动作定义提高协商策略的鲁棒性从而适应不同的协商场景,通过多头语义神经网络和对手偏好预测模块充分利用协商的交互信息.实验结果表明,该策略在不同协商环境下都可以很好地完成协商任务.  相似文献   

12.
在多Agent系统(MAS)环境中,协商是一个复杂的动态交互过程。如何提高协商效率,成为了研究者关注的焦点。应用记忆演化理论的强化学习思想,提出一种Agent协商算法。它与基本强化学习相比,3阶段的记忆演化的强化学习,使得Agent可以在实时回报与延迟回报间更好的做出平衡,并为Agent记忆社会化交互创造条件,使强化学习更适合MAS的要求。通过模拟实验证明该协商算法是有效性的。  相似文献   

13.
This paper firstly proposes a bilateral optimized negotiation model based on reinforcement learning. This model negotiates on the issue price and the quantity, introducing a mediator agent as the mediation mechanism, and uses the improved reinforcement learning negotiation strategy to produce the optimal proposal. In order to further improve the performance of negotiation, this paper then proposes a negotiation method based on the adaptive learning of mediator agent. The simulation results show that the proposed negotiation methods make the efficiency and the performance of the negotiation get improved.  相似文献   

14.
提出了一种基于强化学习的双边优化协商模型。引入了一个中介Agent。在强化学习策略中使用不同的参数产生提议,进而选出最好的参数进行协商。为了进一步提高协商的性能,还提出了基于中介Agent自适应的学习能力。仿真实验结果证明了所提协商方法的有效性,且该方法提高了协商的性能。  相似文献   

15.
基于贝叶斯的多议题协商优化   总被引:1,自引:1,他引:0  
在限时条件下的Agent之间的多议题协商中,虽然最差的结果是没有达成协定,而达成了一个使自己潜在利益受损的协定未必就是好的选择。在很多情况下,由于推理策略和交互机制的不完善使得Agent个体失去自己应得的利益。论文使用贝叶斯方法对协商对手进行预测,尽量使自己的初始信念准确反映对手的意识形态;并在此基础之上提出了一个优化的协商交互模型。在此模型中,Agent个体充分利用自己的预测结果,在协商成功的基础上获得尽可能多的利益。  相似文献   

16.
基于神经网络的Agent电子商务协商模型   总被引:7,自引:0,他引:7  
卢武昌  胡山立 《计算机应用》2005,25(7):1638-1640,1650
提出一个在电子商务中能辅助用户网上采购的智能Agent协商模型,并对模型进行仿真实验,以验证模型的有效性。模型的构造基于BP神经网络,通过对用户的购物偏好训练学习,使Agent获得一组包含用户偏好特征的规则信息并作为协商过程中推理的依据;每次协商的结果都作为学习样本,以提高Agent对市场变化的适应能力。  相似文献   

17.
多Agent多问题协商模型   总被引:42,自引:1,他引:42  
王立春  陈世福 《软件学报》2002,13(8):1637-1643
在多agent环境中,协商是多agent系统能够成功运转的关键.根据参与协商agent的数目和协商问题的数目,多agent环境中的协商可以分为双边-单问题协商、双边-多问题协商、多边-单问题协商、多边-多问题协商.前3种协商是多边-多问题协商在不同维上的简化.利用协商-协商过程-协商线程的概念建立了一个多边-多问题协商模型MMN(multi-agent multi-issue negotiation).该模型通过提供一个灵活的协商协议支持多agent环境中的不同协商形式,并且支持agent在协商过程中的学习.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号