首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
李劲  岳昆  刘惟一 《计算机科学》2007,34(3):181-185
现有的图型博弈Nash均衡求解方法基本是在离散化剖面空间中搜索求解,最终只能得到近似Nash均衡。针对现有求解方法存在的不足,把求解图型博弈的Nash均衡看作是连续策略空间中的函数优化问题,定义Agents在策略剖面中的效用偏离度之和为优化目标,其最优解就是博弈的Nash均衡。本文基于对实例的分析指出目标函数下降梯度的计算可归结为一组线性规划,进而提出一种求解图型博弈Nash均衡的新型梯度下降算法。算法分析及实验研究表明,对于多Agent交互模型中的相关问题,本文提出的方法可求解任意图结构图型博弈Nash均衡,对于大规模图型博弈也有较好的求解精度和求解效率。  相似文献   

2.
研究了一类带Poisson跳扩散过程的线性二次随机微分博弈,包括非零和博弈的Nash均衡策略与零和博弈的鞍点均衡策略问题.利用微分博弈的最大值原理,得到Nash均衡策略的存在条件等价于两个交叉耦合的矩阵Riccati方程存在解,鞍点均衡策略的存在条件等价于一个矩阵Riccati方程存在解的结论,并给出了均衡策略的显式表达及最优性能泛函值.最后,将所得结果应用于现代鲁棒控制中的随机H2/H控制与随机H控制问题,得到了鲁棒控制策略的存在条件及显式表达,并验证所得结果在金融市场投资组合优化问题中的应用.  相似文献   

3.
柴玉梅  张靖 《计算机应用》2007,27(9):2287-2289
在博弈问题中很多学习机制只能使Agent收敛到Nash均衡解,不能很好地满足实际需要。将博弈问题转化为多目标优化问题,提出了一种新的多目标优化策略机制——保留受控策略机制,并将其应用到囚徒困境问题中得到比Nash均衡更有意义的Pareto最优解,在自博弈实验中取得了较高的满意度。实验结果表明,该策略机制求解Pareto最优解的有效性。  相似文献   

4.
状态无关的主动队列管理算法处理分组时不区分分组所在的流的信息,因此在Internet中,它易于设计和部署。文中通过数学分析和仿真方法研究AQM博弈和Nash均衡存在性。假设业务流是Poisson分布的且用户可自由修改发送速率,因而有结论:Drop Tail、RED不能获得Nash均衡,CHOKe可以获得近似Nash均衡。依据判定条件,推导出一种与状态无关且具有效率的Nash均衡AQM算法。  相似文献   

5.
针对带有一对属性值(ai ,bi )的n个agent分配m个资源问题,构建了该问题的博弈模型,给出了判断Nash均衡是否存在的充要条件,利用充要条件对Nash均衡的存在性进行分析和讨论,并且分析了Nash均衡与最优分配的关系。设计了求解最优分配的算法,并证明了算法是收敛的,证明过程显示该算法的收敛性与初始分配无关。  相似文献   

6.
冯坚  杨路明 《微机发展》2007,17(7):127-130
状态无关的主动队列管理算法处理分组时不区分分组所在的流的信息,因此在Internet中,它易于设计和部署。文中通过数学分析和仿真方法研究AQM博弈和Nash均衡存在性。假设业务流是Poisson分布的且用户可自由修改发送速率,因而有结论:Drop Tail、RED不能获得Nash均衡,CHOKe可以获得近似Nash均衡。依据判定条件,推导出一种与状态无关且具有效率的Nash均衡AQM算法。  相似文献   

7.
针对n人非合作博弈多重Nash均衡求解问题,提出一种自适应小生境粒子群算法。该算法融合了序列小生境技术、粒子群优化算法的思想,并加入了变异算子和自动生成小生境半径机制,使得所有粒子尽可能分布到整个搜索空间的不同局部峰值区域,从而有效地求得博弈问题的多重Nash均衡。最后给出几个数值算例,计算结果表明所提出的算法具有较好的性能。  相似文献   

8.
研究线性Markov切换系统的随机Nash微分博弈问题。首先借助线性Markov切换系统随机最优控制的相关结果,得到了有限时域和无线时域Nash均衡解的存在条件等价于其相应微分(代数) Riccati方程存在解,并给出了最优解的显式形式;然后应用相应的微分博弈结果分析线性Markov切换系统的混合H2/H∞控制问题;最后通过数值算例验证了所提出方法的可行性。  相似文献   

9.
基于系统动力学的环境污染演化博弈问题研究   总被引:3,自引:0,他引:3  
用系统动力学建立环境污染管理问题中政府管理部门与生产排污企业之间的一个混合战略演化博弈模型.仿真结果表明:非对称结构的2*2混合策略演化博弈模型不存在演化均衡.从监管部门的角度出发,改变博弈支付矩阵在演化博弈过程始终保持不变的情况,在博弈支付矩阵中考虑动态惩罚策略.结果表明,本策略的演化博弈模型存在演化稳定均衡,即Nash均衡.系统动力学为演化博弈理论的验证和应用提供一个政策仿真实验平台.  相似文献   

10.
决策者在不完全知识条件下进行决策时,一般采用进化策略参与竞争,运用进化算法研究博弈的Nash均衡解是一种新的研究方向。本文运用模拟退火算法建立了一个新的博弈仿真模型,计算机仿真实验验证了所建立模型的有效性。  相似文献   

11.
图型博弈是一种新的博弈表示方法。求解Nash均衡是图型博弈的核心问题。论文把求解图型博弈的Nash均衡看作是离散空间中的优化问题,给出了求解图型博弈ε-Nash均衡的迭代优化算法。另外,为加快算法的收敛速度,提出了一个获得高迭代效率策略剖面的方法:基于博弈的图形结构进行多策略更新。实验结果表明算法是可行、高效的。  相似文献   

12.
不确定性下非合作博弈强Nash均衡的存在性   总被引:2,自引:0,他引:2  
张会娟  张强 《控制与决策》2010,25(8):1251-1254
在已知不确定参数变化范围的假设下,研究了非合作博弈强Nash均衡的存在性问题.基于经典非合作博弈的强Berge均衡及帕雷托均衡的概念,结合非合作博弈NS均衡,定义了不确定性下非合作博弈的帕雷托强Berge和强Nash均衡的概念,并借助Ky Fan不等式证明其存在性.最后利用算例验证了其可行性和有效性.  相似文献   

13.
张霖  徐扬 《计算机科学》2014,41(9):229-231,242
博弈论被广泛应用于描述和解决复杂的主体行为相互作用的决策问题。目前对于非实数值领域的博弈问题,成果很少,故研究支付值为格值类型的二人零和矩阵博弈。基于该类型博弈的特殊性,定义了纯战略纳什均衡解和准均衡解以及混合战略纳什均衡解和准均衡解,并研究解的性质,给出获得解的方法,得到各种解存在的充分必要条件。最后,给出了实例,验证了该方法处理支付值为格值类型的博弈问题的可行性和有效性。  相似文献   

14.
针对突发事件发生后存在多个事故、应急资源有限的情况,提出了基于非合作博弈的应急资源调度模型和算法。在该调度模型中,各个事故点被视为博弈模型的局中人,可能的资源调度方案映射为策略集,将应急资源的调度问题转化为对非合作博弈调度模型的Nash均衡点求解问题,并对基本蚁群算法进行了改进,嵌入了遗传算法的交叉操作和变邻域搜索策略,将其应用于求解该博弈模型的Nash均衡解。最后通过算例测试验证了模型和算法的有效性和可行性。  相似文献   

15.
连续博弈中至少存在一个混合策略Nash均衡,但是关于无限策略混合策略Nash均衡的解法,以及局中人的策略集或是效益函数是不确定性博弈均衡问题,国内外相关的研究成果还比较少。运用粒子群算法对目标函数没有严格要求,参数较少,编码简单的优势,创立了一种计算无限策略混合策略的近似算法;并在此基础上提出了粗糙博弈论的概念,以粗糙集和Vague集的理论为基础,发现了一种粗糙博弈论转化为经典博弈论的方法。无限策略混合策略Nash均衡的近似算法和粗糙博弈论的研究为策略集和效益函数不确定时的博弈问题提供了理论依据。算法示例结果表明,基于改进的粒子群算法的无限策略混合策略Nash均衡近似算法和粗糙博弈论的解法是有效可行的。  相似文献   

16.
考虑n人非合作博弈Nash均衡求解问题。将混合策略意义下的Nash均衡转化为最优化问题;把免疫记忆、自我进化、信息共享机制加入量子粒子群算法,通过概率浓度选择公式来保持种群的多样性,提出协同免疫量子粒子群算法。4个经典的数值算例说明,该算法优于免疫粒子群算法,具有较强的寻优能力和收敛性能。  相似文献   

17.
一种TCP博弈模型的Nash均衡存在性分析与仿真   总被引:1,自引:1,他引:0  
在当今的Internet中,远程教学、大规模传输等“不响应拥塞”应用与日剧增,使得端系统有动机更改拥塞控制方案以满足自己的需要,这加重了Internet拥塞。一般希望通过研究用户非合作博弈行为的Nash均衡来规范自私的端用户行为。阐述了TCP拥塞博弈模型,主体为采取TCP协议的端用户,策略为TCP端用户的慢启动拥塞窗口递增参数。通过数学分析方法论证了网络方对TCP流没有额外的处罚时,TCP博弈存在Nash均衡。同时,通过Ns2仿真工具验证了当路由器采用DropTail队列管理算法,端节点采取TCPTahoe和TCPReno时,TCP博弈存在Nash均衡。这意味着TCP算法对Internet的稳定起着重要作用。  相似文献   

18.
多组对策系统中求解组与组之间的非劣Nash策略至关重要.如何针对一般问题解析求出非劣Nash策略还没有有效的方法.本文阐述了一种利用组与组之间的非劣反应集构造求解非劣Nash策略的迭代算法.为此首先引进多组对策系统组内部合作对策的最优均衡值和最优均衡解的概念,然后通过证明最优均衡解是组内部隐含某一权重向量的合作对策的非劣解,得到求解合作对策的单目标规划问题.进一步说明在组内部该问题的解不仅是非劣解而且对所有局中人都优于不合作时的Nash平衡策略.最后给出了验证该算法有效性的一个实际例子.  相似文献   

19.
基于博弈论的Multi-homing负载均衡   总被引:1,自引:0,他引:1       下载免费PDF全文
针对移动网络的多主接入中的负载均衡问题,提出一种基于博弈论的解决方案。通过建立效用函数,量化用户对带宽的需求,根据用户对网络带宽的需求建立Bertrand博弈模型,求解出用户需求带宽的Nash均衡价格,并利用Nash均衡价格调整带宽资源的分配,从而最大化网络自身收益。仿真结果证明算法是有效的,该方案能够合理有效地利用带宽资源,实现了负载均衡。  相似文献   

20.
在有限理性的基础上,对N人合作博弈的对称Nash均衡进行了分析,并引入演化博弈理论分析了参与人的演化均衡稳定策略,得到了不同策略选择下的均衡点。进而应用生物复制动态理论对离散时间及连续时间下的复制动态稳定集进行了研究。最后通过实例说明了该方法在博弈均衡选择上的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号