首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 59 毫秒
1.
本文讨论上级宣布策略后随从进行Nash不合作对策时的诱导问题.由于Nash不合作平衡点的不唯一性,本文提出了拟诱导策略,弱诱导策略和强诱导策略的概念。当随从目标函数是凸函数时,得到了仿射型拟诱导策略和仿射型弱诱导策略的存在条件与设计方法,当随从目标函数是正定二次函数时,得到了仿射型强诱导策略的存在条件与设计方法,并有示例说明本文的结论。  相似文献   

2.
多随从诱导策略   总被引:1,自引:0,他引:1  
徐春晖  陈珽 《自动化学报》1991,17(5):577-581
本文研究多随从诱导问题.当随从进行Nash不合作对策时,得到了连续诱导策略的一个存在性充分条件与一种设计方法;当随从进行Nash协商对策时,得到了仿射型和连续型诱导策略的存在性充分条件与设计方法.  相似文献   

3.
从方具有多目标的仿射型诱导策略研究   总被引:1,自引:0,他引:1  
金武 《控制与决策》1994,9(5):375-378
本文讨论当从方具有多个目标,主方对从方的诱地策略设计问题,给出了最优诱导策略和可诱导域的定义,研究了仿射型诱导策略的存在条件及解的结构形式,并探讨了当主方只具有对从方决策的部分观测时的诱导问题。  相似文献   

4.
徐春晖 《自动化学报》1991,17(3):379-381
一、引言诱导问题的基本要素可记为 u,U(?)R~m:上级的决策变量与决策空间, v,V(?)R~n:下级的决策变量与决策空间, J_0(u,v),J_1,(u,v):上下级的代价目标函数, (u~t,u~t)∈U×V:上级的期望结局,  相似文献   

5.
贺正冰  关伟 《控制与决策》2013,28(7):1046-1050
受检测器和诱导信息板显示形式的限制,诱导信息更新周期通常较长。为此,根据备选路径交通状态而非行驶时间制定诱导策略,利用交通状态相对稳定的特点,进一步提出状态反馈诱导策略;为减少长周期与时变交通需求间的矛盾及其他误差,提出了状态与时间反馈策略相结合的混合策略。仿真实验表明,面对长周期时,状态反馈策略可以满足稳定性和准确性的双重要求,混合策略则进一步提高了诱导的准确性。  相似文献   

6.
多组对策系统中求解组与组之间的非劣Nash策略至关重要.如何针对一般问题解析求出非劣Nash策略还没有有效的方法.本文阐述了一种利用组与组之间的非劣反应集构造求解非劣Nash策略的迭代算法.为此首先引进多组对策系统组内部合作对策的最优均衡值和最优均衡解的概念,然后通过证明最优均衡解是组内部隐含某一权重向量的合作对策的非劣解,得到求解合作对策的单目标规划问题.进一步说明在组内部该问题的解不仅是非劣解而且对所有局中人都优于不合作时的Nash平衡策略.最后给出了验证该算法有效性的一个实际例子.  相似文献   

7.
针对多用户多优先级网络系统的管理问题,利用对策论中的Nash平衡和激励Stackelberg策略等相关概念,提出了理想状态下的激励价控策略设计.在系统的动态平衡状态下,利用信息量的瞬时变化率及用户与平衡点的偏离,给出了非线性交叉干扰的多激励价控策略,加强了用户与网络管理者的合作性,激励和引导非合作用户选取对系统整体有益的服务请求,以提高网络资源的利用率.  相似文献   

8.
研究了非合作用户的网络定价问题.将对策论中主从策略的思想应用到定价策略中,首先分析了在Nash平衡态下使主方收益达到最大时价格所满足的条件;然后结合网络市场的供求关系,将Nash平衡点视为供求平衡点,从而确定了相应的价格;最后以数值例子得出Nash平衡态下用户的速率和网络的收益.结果表明,合理的价控策略能够激发用户合理地使用网络资源,同时给管理者带来最优收入.  相似文献   

9.
基于小波多尺度逼近特性,提出了一种求解线性时变系统中微分对策Nash策略的新方法.该法避免求解耦合Riccati微分方程,而只需求解代数方程,适合于计算机求解.  相似文献   

10.
郭文革   《自动化学报》1998,24(1):56-63
基于争议双方对仲裁人的裁决值有不同概率估计这一前提分析组合仲裁.构造了它 的非合作对策模型.然后利用此模型,在多种情形下探讨了Nash均衡报价策略的存在性,得 出了组合仲裁不能诱导争议双方报价收敛的结论,这与Brams和Merrll Ⅱ在争议双方对裁 决值有相同概率估计前提下获得的著名结论正好相反.最后分析了当一方变得风险厌恶时, 对争议双方报价的影响.  相似文献   

11.
QoS routing mechanisms allow users identify paths that can accommodate their performance requirements and reserve the necessary resources. An important problem is how to conduct such resource allocation efficiently, not only from the single-connection, but also from the network point of view. We propose the use of pricing mechanisms as a means to regulate the users' decisions in a networkwide efficient manner. Focusing on QoS architectures that employ rate-based schedulers, we formulate a congestion-based pricing scheme. We establish the structure of the corresponding user-optimal response, i.e., a path selection algorithm that satisfies the user's requirements at minimal cost. We show that the underlying noncooperative game among users has a unique equilibrium, for any particular choice of price functions. Then, we establish the existence of incentive compatible price functions, which drive the network into an equilibrium point that coincides with the optimum of a social function. Specifically, these price functions are the derivatives of the social function. We then extend our results to scenarios in which users can identify only sub-optimal paths, as is often the case with multi-constrained path optimization.  相似文献   

12.
13.
基于LQ微分对策的最优规避策略与决策算法   总被引:2,自引:0,他引:2  
针对信息化条件下飞行器通过"智能"机动方式来规避拦截这一问题,基于LQ微分对策方法对最优规避参数的决策问题进行了研究.首先,将微分对策引入LQ最优控制算法,建立了飞行器规避拦截问题的数学模型;其次,提出了将Hamil-ton-Yaceobi伴随向量与共轭法相结合的共轭决策方法,简化了微分对策的求解,并得到了最优规避参数的解析解;给出了规避策略中不同参数对规避效果的不同灵敏度,并给出了最优规避参数的决策算法;最后,针对不同的对抗情形,进行了数字仿真,检验了本文微分对策模型的合理性和算法的有效性.  相似文献   

14.
针对从方具有威胁性的向量主从对策,提出了一类防从方威胁的非线性鼓励策略,推广了文献[2]的结论。  相似文献   

15.
邢登鹏  刘旭 《自动化学报》2011,37(2):228-233
设计了全状态反馈参数化控制器用于仿人机器人在站立平衡中应对外界冲击力与持续力. 采用多个机器人模型模仿人类站立平衡中的多个应对策略. 对每个模型, 设计了参数控制器作用于每一个状态误差, 并针对不同的作用力大小、方向和位置优化控制器参数. 应对不同外界作用力展现了该控制器的性能. 通过比较每一个策略处理干扰力的能力, 本文也探索了每个关节在站立平衡中的作用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号