期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡浩洋郭雷《控制理论与应用》2018,35(5):637-643

本文考虑系数未知的离散时间线性随机系统多人非合作的自适应博弈问题,每个参与者运用最小二乘算法和"必然等价原则"来设计博弈策略组合,目的是自适应优化自身的一步超前收益函数.本文证明此自适应策略组合使得闭环系统全局稳定,并且在一定意义下是该博弈问题的渐近纳什均衡解. 相似文献

2.

一种可信的自适应服务组合机制 总被引：7，自引：0，他引：7

郭慧鹏怀进鹏邓婷李扬《计算机学报》2008,31(8)

提出一种可信的自适应服务组合机制.首先,将组合服务的可信性保证问题转换为自适应控制问题,可信性保证策略作为可调节控制器,组合服务作为被控对象,并设计了相应的系统结构;其次,在马尔可夫决策过程框架下建模和优化组合服务的可信维护过程和策略,并设计了相应的算法,实现了基于强化学习的直接自适应控制机制;最后,通过仿真实验,将组合服务的自适应维护与随机维护策略比较,表明组合服务的自适应维护具有明显的优越性. 相似文献

3.

面向环境自适应组合服务系统的环境变化识别

蔡任杰张斌高岩李飞《小型微型计算机系统》2012,33(9):1885-1891

环境自适应的组合服务系统是未来软件系统的一个发展方向,不同于普通组合服务系统之处在于这种系统对系统运行的网络环境进行监测,并根据监测结果对组合服务进行合适的调整以保证软件系统的服务质量.由于通常的类别匹配式环境感知策略不满足系统中服务QoS连续性的需求,本文经过分析环境自适应的组合服务系统的运行原理,提出一个基于动态QoS计算的环境变化识别方法,实现了从环境监测到输出变化事件的系统的环境感知功能,给出了环境监测及变化识别策略,设计了整体的变化识别算法以及其中具体的变化识别阈值计算算法,并通过实验结果表明了变化识别方法可以良好并高效地完成系统的环境感知需求. 相似文献

4.

不对称约束多人非零和博弈的自适应评判控制

李梦花王鼎乔俊飞《控制理论与应用》2023,40(9):1562-1568

本文针对连续时间非线性系统的不对称约束多人非零和博弈问题, 建立了一种基于神经网络的自适应评判控制方法. 首先, 本文提出了一种新颖的非二次型函数来处理不对称约束问题, 并且推导出最优控制律和耦合Hamilton-Jacobi方程. 值得注意的是, 当系统状态为零时, 最优控制策略是不为零的, 这与以往不同. 然后, 通过构建单一评判网络来近似每个玩家的最优代价函数, 从而获得相关的近似最优控制策略. 同时, 在评判学习期间发展了一种新的权值更新规则. 此外, 通过利用Lyapunov理论证明了评判网络权值近似误差和闭环系统状态的稳定性. 最后, 仿真结果验证了本文所提方法的有效性相似文献

5.

基于事件驱动控制的混杂动态博弈系统的纳什均衡分析

陈向勇曹进德赵峰姜晓伟《控制理论与应用》2021,38(11):1801-1808

本文研究了基于事件驱动控制的混杂动态博弈系统的纳什均衡分析问题. 首先, 分析了事件驱动机制对混杂动态博弈过程的影响, 进而, 在进行状态空间描述的基础上, 给出了混杂动态博弈的纳什均衡的定义, 并建立了对应博弈系统的策略型模型. 其次, 结合Lanchester方程, 分别讨论了两类混杂动态博弈系统的均衡问题, 包括事件驱动策略设计和固定的情况, 获得了均衡解存在的必要条件. 最后, 通过数值模拟进行了应用分析, 验证了所取得结果的合理性和科学性, 并总结了混杂动态博弈研究的未来工作. 相似文献

6.

基于博弈学习的动态频谱分配算法研究

徐浩漫唐伦陈前斌《计算机仿真》2010,27(5):100-104

为了解决认知无线网络中的动态频谱分配问题,提高频谱利用率和避免干扰,提出了一种基于学习的库诺(Cournot)博弈模型,将授权用户对于空闲频谱的分配行为模拟为动态的博弈过程,并赋予授权用户学习的能力,通过对博弈过程中博弈者行为的学习和总结形成新的博弈策略,而且还比较了将最优反应学习算法和模拟退火算法应用到自适应博弈学习中系统的性能和用户的收益。仿真结果表明,两种算法均能够使授权用户通过学习达到策略的均衡,而有限理性下基于模拟退火的自适应博弈学习算法的鲁棒性更强,收敛性更好,且能够使授权用户获得更高的收益。相似文献

7.

自适应并行蚁群算法

姚宝珍《模式识别与人工智能》2007,20(4)

蚁群算法是一种模拟进化算法,具有很强的全局搜索能力.本文提出一种自适应的并行蚁群算法(A-PACO),该算法可以根据不同的搜索阶段,自适应确定参数的最优组合,在一定程度上避免停滞现象的出现并加速算法收敛.而且自适应的迁移策略可以较大丰富系统多样性的同时也较大降低子蚁群间的通信量,有效提高算法的搜索质量和缩短算法的运行时间.最后选用中国CHN144问题对该算法进行检验,结果显示该算法具有较好的稳定性和较快的收敛速度. 相似文献

8.

具有可参数化不确定性系统的对偶自适应模型预测控制

曹文祺李少远《控制理论与应用》2019,36(8):1197-1206

控制系统中存在的不确定性为其性能优化带来诸多问题.自适应控制和鲁棒控制是针对系统存在的不确定性而采取的不同设计策略;前者没有充分考虑系统的未建模动态,而后者往往是针对不确定的最大界而设计,具有较强的保守性.本文试图将自适应控制和鲁棒控制的策略相结合,提出了一种在模型预测控制中利用未来不确定信息的对偶自适应模型预测控制策略.该策略将系统中由未建模动态引起的不确定性参数化表达,并为其设定边界约束,作为优化问题中新的约束,在优化控制目标的同时减小系统不确定性对控制的影响.仿真结果表明,本文提出的算法较传统自适应模型预测控制算法,对于系统存在的不确定性由于在迭代过程中采用参数化描述,得到了更好的系统性能,且具有更好的收敛性. 相似文献

9.

有限次重复囚徒博弈中的合作机制研究

杨城吕峻闽缪春池《计算机应用研究》2012,29(4):1322-1325

模仿现实中人们的决策方式,提出类"触发策略"的策略思想,将原问题由双策略的多阶段博弈转换为多策略的一次性博弈,并建立起扩展的支付矩阵;然后运用进化博弈理论,将随机扰动引入复制子动态,从理论上说明有限次重复囚徒博弈之所以能够涌现合作是复制效应和变异效应共同作用的结果;最后通过建立多主体系统的仿真模型,进一步分析和验证了合作涌现的门限条件和稳定状态。相似文献

10.

基于博弈理论的经济网格资源配置研究

林晓鹏《计算机技术与发展》2012,(10)

针对经济网格中,由于网格系统的复杂性和用户的私利性,使得网格用户在资源竞价过程中往往因相关信息的匮乏而导致资源竞价的盲目性问题,根据重复博弈分阶段执行的特点,将网格用户间对网格资源的竞争看作多阶段的重复博弈过程.用户依据前一阶段博弈的竞价值及竞价结果对当前阶段的竞价策略进行调整,通过有限次的阶段博弈达到均衡出价策略组合,实现用户最大效用下的资源分配.仿真表明,在不完全信息的网格环境中,该竞价模型可逐步改善网格用户的资源竞价策略,实现优化目标最大化下的网格资源分配. 相似文献

11.

信息安全技术投资的自适应模型

董红邱菀华吕俊杰张雯《控制与决策》2008,23(5):535-540

根据攻防双方信息不对称现象,结合不完全信息博弈论及信息安全的有关理论,构建一个基于成本-收益的信息安全技术选择的投资博弈模型,得出在两种不同的安全技术配置下(仅使用防火墙或防火墙与入侵检测系统共用)博弈双方的最优策略.通过对用户攻击率、系统响应率和入侵给系统带来的损失及系统的响应成本进行分析比较,探讨了安全技术的价值,从而给出能动态调整安全技术的自适应入侵响应策略.最后通过实例进一步验证了相关结论. 相似文献

12.

系统直和博弈模型下的合作演化

李亚昆冯俊娥《控制理论与应用》2020,37(8):1717-1726

演化博弈论是生物进化论与博弈论结合产生的理论,已成为研究合作演化行为的有力工具.本文研究了基于系统直和博弈模型下的合作演化行为.首先,利用复制者方程分析了双人双策略及三策略对称博弈的演化动力学过程.然后,以石头剪刀布模型和雪堆模型为基础,采用矩阵直和构建系统直和博弈模型,并将所构造的直和矩阵转化为含参数的系统总支付矩阵.随后,说明了这种方法可推广到n个博弈的情形.最后,利用MATLAB对系统直和博弈模型进行仿真模拟,从系统整体的角度分析合作演化.仿真结果表明,混合之后的系统直和博弈较单一博弈而言,合作策略的占比明显增加,且整个系统稳定性更好.这种合作演化机制呈现了全局互惠. 相似文献

13.

未知非线性零和博弈最优跟踪的事件触发控制设计

王鼎胡凌治赵明明哈明鸣乔俊飞《自动化学报》2023,49(1):91-101

设计了一种基于事件的迭代自适应评判算法,用于解决一类非仿射系统的零和博弈最优跟踪控制问题.通过数值求解方法得到参考轨迹的稳定控制,进而将未知非线性系统的零和博弈最优跟踪控制问题转化为误差系统的最优调节问题.为了保证闭环系统在具有良好控制性能的基础上有效地提高资源利用率,引入一个合适的事件触发条件来获得阶段性更新的跟踪策略对.然后,根据设计的触发条件,采用Lyapunov方法证明误差系统的渐近稳定性.接着,通过构建四个神经网络,来促进所提算法的实现.为了提高目标轨迹对应稳定控制的精度,采用模型网络直接逼近未知系统函数而不是误差动态系统.构建评判网络、执行网络和扰动网络用于近似迭代代价函数和迭代跟踪策略对.最后,通过两个仿真实例,验证该控制方法的可行性和有效性. 相似文献

14.

基于强化学习的自适应多Agent系统的构造

沈乐毛新军董孟高《计算机工程与科学》2011,33(12):72-77

自适应系统所处的环境往往是不确定的,其变化事先难以预测,如何支持这种环境下复杂自适应系统的开发已经成为软件工程领域面临的一项重要挑战.强化学习是机器学习领域中的一个重要分支,强化学习系统能够通过不断试错的方式,学习环境状态到可执行动作的最优对应策略.本文针对自适应系统环境不确定的问题,将Agent技术与强化学习技术相结... 相似文献

15.

以多人博弈效用函数为演化指导函数的演化算法

徐敏张四海王煦法《模式识别与人工智能》2006,19(6)

研究一种基于多人纯策略非合作博弈的演化优化算法,可用于一类组合优化问题的求解.该算法的演化过程可建模为一个马尔科夫链模型.它将组合优化问题映射为多人非合作博弈,通过博弈主体的理性行为对问题的解进行优化.给出定义良好并可供扩展的算法框架,明确算法的要素所必须满足的3个约束:有限性约束、弱一致性约束和收敛性约束,并应用于若干典型NP-Hard的组合优化问题的求解.理论和实验结果表明,与一些传统优化算法相比,本算法在实际应用中具有良好的问题求解能力. 相似文献

16.

基于完全信息博弈的"沙漠掘金"游戏策略

曾梓怡张世雄冀成知远李厚彪《计算机应用》2021,41(z2):93-97

为寻求益智类游戏"沙漠掘金"在多人参与下的游戏策略,针对具体的游戏规则进行了深入的分析,分别提出了基于完全信息静态博弈与完全信息动态博弈的游戏策略.首先,通过简化游戏规则将其转变为一个非合作博弈问题.其次,考虑单人游戏中的最优化问题,分析单人游戏的策略并在此基础上采用博弈论的方法对多人游戏的情况进行求解.最后,针对第一关,满足完全信息静态博弈的情况,模拟玩家行动,得出博弈支付矩阵,通过混合策略纳什均衡的方法计算最优策略;针对第二关,满足完全信息动态博弈的情况,构建博弈树并通过逆向递归求解得出最佳的游戏攻略,并分析了多人竞争策略. 相似文献

17.

基于完全信息博弈的"沙漠掘金"游戏策略

曾梓怡张世雄冀成知远李厚彪《计算机应用》2021,41(z2):93-97

为寻求益智类游戏"沙漠掘金"在多人参与下的游戏策略,针对具体的游戏规则进行了深入的分析,分别提出了基于完全信息静态博弈与完全信息动态博弈的游戏策略.首先,通过简化游戏规则将其转变为一个非合作博弈问题.其次,考虑单人游戏中的最优化问题,分析单人游戏的策略并在此基础上采用博弈论的方法对多人游戏的情况进行求解.最后,针对第一关,满足完全信息静态博弈的情况,模拟玩家行动,得出博弈支付矩阵,通过混合策略纳什均衡的方法计算最优策略;针对第二关,满足完全信息动态博弈的情况,构建博弈树并通过逆向递归求解得出最佳的游戏攻略,并分析了多人竞争策略. 相似文献

18.

三方多策略式博弈系统的长期演化稳定均衡特性研究

程乐峰杨汝王晓刚余涛《控制理论与应用》2021,38(10):1631-1661

演化博弈论(EGT)基于有限理性假设且更加贴近现实,近年来已在众多领域得到了初步应用.基于此,本文关注一类较为常见的三方多策略式演化博弈系统,尝试通过理论分析总结其长期演化稳定均衡(ESE)特性,并进行仿真验证研究.首先,研究了一般情形下的三方两策略对称与非对称演化博弈系统;然后,将其扩展到更复杂的三方三策略非对称演化博弈类型,并对其长期ESE特性进行了理论分析与动态仿真验证;进一步,对通用三方n-策略(n 1)非对称演化博弈的建模思路进行了阐述与总结,给出其收敛迭代的计算方法.研究过程中详细定义了各类演化博弈模型的相对净支付(RNP)参数.实验结果表明可通过一些外部因素适当调整RNP参数使各类系统朝着期望的长期ESE状态自发收敛.最后,进行了实例验证.本文研究模型、方法和所得结论具有一定普适性,旨在丰富EGT研究,尤其是三方多策略演化博弈问题研究,并为相关领域非完全理性人参与的行为决策问题研究提供一些思路和理论参考. 相似文献

19.

基于博弈遗传算法的组合电路进化设计 总被引：1，自引：0，他引：1

徐海芹丁永生胡志华《计算机应用》2009,29(3):900-902

为了有效提高组合逻辑电路进化设计的速度和效率,提出了一种基于博弈遗传算法的电路进化设计算法。将组合电路中的每个输出端作为博弈者,组成每个输出端的逻辑门之间的连接和组态作为策略,将电路优化问题转化为博弈优化决策问题,策略的选择通过遗传算法实现,从而建立了组合电路优化设计的博弈模型。最后通过仿真实验验证该算法的有效性。相似文献

20.

基于系统动力学的环境污染演化博弈问题研究 总被引：3，自引：0，他引：3

蔡玲如王红卫曾伟《计算机科学》2009,36(8):234-238

用系统动力学建立环境污染管理问题中政府管理部门与生产排污企业之间的一个混合战略演化博弈模型.仿真结果表明:非对称结构的2*2混合策略演化博弈模型不存在演化均衡.从监管部门的角度出发,改变博弈支付矩阵在演化博弈过程始终保持不变的情况,在博弈支付矩阵中考虑动态惩罚策略.结果表明,本策略的演化博弈模型存在演化稳定均衡,即Nash均衡.系统动力学为演化博弈理论的验证和应用提供一个政策仿真实验平台. 相似文献