共查询到20条相似文献,搜索用时 31 毫秒
1.
本文考虑系数未知的离散时间线性随机系统多人非合作的自适应博弈问题,每个参与者运用最小二乘算法和"必然等价原则"来设计博弈策略组合,目的是自适应优化自身的一步超前收益函数.本文证明此自适应策略组合使得闭环系统全局稳定,并且在一定意义下是该博弈问题的渐近纳什均衡解. 相似文献
2.
3.
环境自适应的组合服务系统是未来软件系统的一个发展方向,不同于普通组合服务系统之处在于这种系统对系统运行的网络环境进行监测,并根据监测结果对组合服务进行合适的调整以保证软件系统的服务质量.由于通常的类别匹配式环境感知策略不满足系统中服务QoS连续性的需求,本文经过分析环境自适应的组合服务系统的运行原理,提出一个基于动态QoS计算的环境变化识别方法,实现了从环境监测到输出变化事件的系统的环境感知功能,给出了环境监测及变化识别策略,设计了整体的变化识别算法以及其中具体的变化识别阈值计算算法,并通过实验结果表明了变化识别方法可以良好并高效地完成系统的环境感知需求. 相似文献
4.
本文针对连续时间非线性系统的不对称约束多人非零和博弈问题, 建立了一种基于神经网络的自适应评判控制方法. 首先, 本文提出了一种新颖的非二次型函数来处理不对称约束问题, 并且推导出最优控制律和耦合Hamilton-Jacobi方程. 值得注意的是, 当系统状态为零时, 最优控制策略是不为零的, 这与以往不同. 然后, 通过构建单一评判网络来近似每个玩家的最优代价函数, 从而获得相关的近似最优控制策略. 同时, 在评判学习期间发展了一种新的权值更新规则. 此外, 通过利用Lyapunov理论证明了评判网络权值近似误差和闭环系统状态的稳定性. 最后, 仿真结果验证了本文所提方法的有效性 相似文献
5.
本文研究了基于事件驱动控制的混杂动态博弈系统的纳什均衡分析问题. 首先, 分析了事件驱动机制对混
杂动态博弈过程的影响, 进而, 在进行状态空间描述的基础上, 给出了混杂动态博弈的纳什均衡的定义, 并建立了对
应博弈系统的策略型模型. 其次, 结合Lanchester方程, 分别讨论了两类混杂动态博弈系统的均衡问题, 包括事件驱
动策略设计和固定的情况, 获得了均衡解存在的必要条件. 最后, 通过数值模拟进行了应用分析, 验证了所取得结果
的合理性和科学性, 并总结了混杂动态博弈研究的未来工作. 相似文献
6.
为了解决认知无线网络中的动态频谱分配问题,提高频谱利用率和避免干扰,提出了一种基于学习的库诺(Cournot)博弈模型,将授权用户对于空闲频谱的分配行为模拟为动态的博弈过程,并赋予授权用户学习的能力,通过对博弈过程中博弈者行为的学习和总结形成新的博弈策略,而且还比较了将最优反应学习算法和模拟退火算法应用到自适应博弈学习中系统的性能和用户的收益。仿真结果表明,两种算法均能够使授权用户通过学习达到策略的均衡,而有限理性下基于模拟退火的自适应博弈学习算法的鲁棒性更强,收敛性更好,且能够使授权用户获得更高的收益。 相似文献
7.
姚宝珍 《模式识别与人工智能》2007,20(4)
蚁群算法是一种模拟进化算法,具有很强的全局搜索能力.本文提出一种自适应的并行蚁群算法(A-PACO),该算法可以根据不同的搜索阶段,自适应确定参数的最优组合,在一定程度上避免停滞现象的出现并加速算法收敛.而且自适应的迁移策略可以较大丰富系统多样性的同时也较大降低子蚁群间的通信量,有效提高算法的搜索质量和缩短算法的运行时间.最后选用中国CHN144问题对该算法进行检验,结果显示该算法具有较好的稳定性和较快的收敛速度. 相似文献
8.
控制系统中存在的不确定性为其性能优化带来诸多问题.自适应控制和鲁棒控制是针对系统存在的不确定性而采取的不同设计策略;前者没有充分考虑系统的未建模动态,而后者往往是针对不确定的最大界而设计,具有较强的保守性.本文试图将自适应控制和鲁棒控制的策略相结合,提出了一种在模型预测控制中利用未来不确定信息的对偶自适应模型预测控制策略.该策略将系统中由未建模动态引起的不确定性参数化表达,并为其设定边界约束,作为优化问题中新的约束,在优化控制目标的同时减小系统不确定性对控制的影响.仿真结果表明,本文提出的算法较传统自适应模型预测控制算法,对于系统存在的不确定性由于在迭代过程中采用参数化描述,得到了更好的系统性能,且具有更好的收敛性. 相似文献
9.
10.
林晓鹏 《计算机技术与发展》2012,(10)
针对经济网格中,由于网格系统的复杂性和用户的私利性,使得网格用户在资源竞价过程中往往因相关信息的匮乏而导致资源竞价的盲目性问题,根据重复博弈分阶段执行的特点,将网格用户间对网格资源的竞争看作多阶段的重复博弈过程.用户依据前一阶段博弈的竞价值及竞价结果对当前阶段的竞价策略进行调整,通过有限次的阶段博弈达到均衡出价策略组合,实现用户最大效用下的资源分配.仿真表明,在不完全信息的网格环境中,该竞价模型可逐步改善网格用户的资源竞价策略,实现优化目标最大化下的网格资源分配. 相似文献
11.
12.
演化博弈论是生物进化论与博弈论结合产生的理论,已成为研究合作演化行为的有力工具.本文研究了基于系统直和博弈模型下的合作演化行为.首先,利用复制者方程分析了双人双策略及三策略对称博弈的演化动力学过程.然后,以石头剪刀布模型和雪堆模型为基础,采用矩阵直和构建系统直和博弈模型,并将所构造的直和矩阵转化为含参数的系统总支付矩阵.随后,说明了这种方法可推广到n个博弈的情形.最后,利用MATLAB对系统直和博弈模型进行仿真模拟,从系统整体的角度分析合作演化.仿真结果表明,混合之后的系统直和博弈较单一博弈而言,合作策略的占比明显增加,且整个系统稳定性更好.这种合作演化机制呈现了全局互惠. 相似文献
13.
设计了一种基于事件的迭代自适应评判算法,用于解决一类非仿射系统的零和博弈最优跟踪控制问题.通过数值求解方法得到参考轨迹的稳定控制,进而将未知非线性系统的零和博弈最优跟踪控制问题转化为误差系统的最优调节问题.为了保证闭环系统在具有良好控制性能的基础上有效地提高资源利用率,引入一个合适的事件触发条件来获得阶段性更新的跟踪策略对.然后,根据设计的触发条件,采用Lyapunov方法证明误差系统的渐近稳定性.接着,通过构建四个神经网络,来促进所提算法的实现.为了提高目标轨迹对应稳定控制的精度,采用模型网络直接逼近未知系统函数而不是误差动态系统.构建评判网络、执行网络和扰动网络用于近似迭代代价函数和迭代跟踪策略对.最后,通过两个仿真实例,验证该控制方法的可行性和有效性. 相似文献
14.
自适应系统所处的环境往往是不确定的,其变化事先难以预测,如何支持这种环境下复杂自适应系统的开发已经成为软件工程领域面临的一项重要挑战.强化学习是机器学习领域中的一个重要分支,强化学习系统能够通过不断试错的方式,学习环境状态到可执行动作的最优对应策略.本文针对自适应系统环境不确定的问题,将Agent技术与强化学习技术相结... 相似文献
15.
研究一种基于多人纯策略非合作博弈的演化优化算法,可用于一类组合优化问题的求解.该算法的演化过程可建模为一个马尔科夫链模型.它将组合优化问题映射为多人非合作博弈,通过博弈主体的理性行为对问题的解进行优化.给出定义良好并可供扩展的算法框架,明确算法的要素所必须满足的3个约束:有限性约束、弱一致性约束和收敛性约束,并应用于若干典型NP-Hard的组合优化问题的求解.理论和实验结果表明,与一些传统优化算法相比,本算法在实际应用中具有良好的问题求解能力. 相似文献
16.
为寻求益智类游戏"沙漠掘金"在多人参与下的游戏策略,针对具体的游戏规则进行了深入的分析,分别提出了基于完全信息静态博弈与完全信息动态博弈的游戏策略.首先,通过简化游戏规则将其转变为一个非合作博弈问题.其次,考虑单人游戏中的最优化问题,分析单人游戏的策略并在此基础上采用博弈论的方法对多人游戏的情况进行求解.最后,针对第一关,满足完全信息静态博弈的情况,模拟玩家行动,得出博弈支付矩阵,通过混合策略纳什均衡的方法计算最优策略;针对第二关,满足完全信息动态博弈的情况,构建博弈树并通过逆向递归求解得出最佳的游戏攻略,并分析了多人竞争策略. 相似文献
17.
为寻求益智类游戏"沙漠掘金"在多人参与下的游戏策略,针对具体的游戏规则进行了深入的分析,分别提出了基于完全信息静态博弈与完全信息动态博弈的游戏策略.首先,通过简化游戏规则将其转变为一个非合作博弈问题.其次,考虑单人游戏中的最优化问题,分析单人游戏的策略并在此基础上采用博弈论的方法对多人游戏的情况进行求解.最后,针对第一关,满足完全信息静态博弈的情况,模拟玩家行动,得出博弈支付矩阵,通过混合策略纳什均衡的方法计算最优策略;针对第二关,满足完全信息动态博弈的情况,构建博弈树并通过逆向递归求解得出最佳的游戏攻略,并分析了多人竞争策略. 相似文献
18.
演化博弈论(EGT)基于有限理性假设且更加贴近现实,近年来已在众多领域得到了初步应用.基于此,本文关注一类较为常见的三方多策略式演化博弈系统,尝试通过理论分析总结其长期演化稳定均衡(ESE)特性,并进行仿真验证研究.首先,研究了一般情形下的三方两策略对称与非对称演化博弈系统;然后,将其扩展到更复杂的三方三策略非对称演化博弈类型,并对其长期ESE特性进行了理论分析与动态仿真验证;进一步,对通用三方n-策略(n 1)非对称演化博弈的建模思路进行了阐述与总结,给出其收敛迭代的计算方法.研究过程中详细定义了各类演化博弈模型的相对净支付(RNP)参数.实验结果表明可通过一些外部因素适当调整RNP参数使各类系统朝着期望的长期ESE状态自发收敛.最后,进行了实例验证.本文研究模型、方法和所得结论具有一定普适性,旨在丰富EGT研究,尤其是三方多策略演化博弈问题研究,并为相关领域非完全理性人参与的行为决策问题研究提供一些思路和理论参考. 相似文献
19.