期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

多随从非线性诱导策略 总被引：1，自引：0，他引：1

张成科《自动化学报》1994,20(3):342-347

利用不变凸性的性质研究静态多随从诱导问题,得到了一类非线性诱导策略的存在性条件. 相似文献

2.

多随从诱导策略 总被引：1，自引：0，他引：1

徐春晖陈珽《自动化学报》1991,17(5):577-581

本文研究多随从诱导问题.当随从进行Nash不合作对策时,得到了连续诱导策略的一个存在性充分条件与一种设计方法;当随从进行Nash协商对策时,得到了仿射型和连续型诱导策略的存在性充分条件与设计方法. 相似文献

3.

基于Nash平衡点的网络收益优化策略

杨木易潘伟井元伟何凌《控制与决策》2007,22(6):643-646

研究了非合作用户的网络定价问题．将对策论中主从策略的思想应用到定价策略中,首先分析了在Nash平衡态下使主方收益达到最大时价格所满足的条件;然后结合网络市场的供求关系,将Nash平衡点视为供求平衡点,从而确定了相应的价格;最后以数值例子得出Nash平衡态下用户的速率和网络的收益．结果表明,合理的价控策略能够激发用户合理地使用网络资源,同时给管理者带来最优收入．相似文献

4.

从方具有多目标的仿射型诱导策略研究 总被引：1，自引：0，他引：1

金武《控制与决策》1994,9(5):375-378

本文讨论当从方具有多个目标，主方对从方的诱地策略设计问题，给出了最优诱导策略和可诱导域的定义，研究了仿射型诱导策略的存在条件及解的结构形式，并探讨了当主方只具有对从方决策的部分观测时的诱导问题。相似文献

5.

面向长周期的交通状态反馈诱导策略

贺正冰关伟《控制与决策》2013,28(7):1046-1050

受检测器和诱导信息板显示形式的限制,诱导信息更新周期通常较长。为此,根据备选路径交通状态而非行驶时间制定诱导策略,利用交通状态相对稳定的特点,进一步提出状态反馈诱导策略;为减少长周期与时变交通需求间的矛盾及其他误差,提出了状态与时间反馈策略相结合的混合策略。仿真实验表明,面对长周期时,状态反馈策略可以满足稳定性和准确性的双重要求,混合策略则进一步提高了诱导的准确性。相似文献

6.

不确定性下非合作博弈强Nash均衡的存在性 总被引：2，自引：0，他引：2

张会娟张强《控制与决策》2010,25(8):1251-1254

在已知不确定参数变化范围的假设下,研究了非合作博弈强Nash均衡的存在性问题.基于经典非合作博弈的强Berge均衡及帕雷托均衡的概念,结合非合作博弈NS均衡,定义了不确定性下非合作博弈的帕雷托强Berge和强Nash均衡的概念,并借助Ky Fan不等式证明其存在性.最后利用算例验证了其可行性和有效性. 相似文献

7.

基于一般和随机对策论框架下的多智能体学习

欧海涛张卫东许晓鸣《自动化学报》2002,28(3):423-426

将Q-learning从单智能体框架上扩展到非合作的多智能体框架上,建立了在一般和随机对策框架下的多智能体理论框架和学习算法,提出了以Nash平衡点作为学习目标.给出了对策结构的约束条件,并证明了在此约束条件下算法的收敛性,对多智能体系统的研究与应用有重要意义. 相似文献

8.

连续诱导策略设计的新方法:隐函数法

徐春晖《自动化学报》1991,17(3):379-381

一、引言诱导问题的基本要素可记为 u,U(?)R~m:上级的决策变量与决策空间, v,V(?)R~n:下级的决策变量与决策空间, J_0(u,v),J_1,(u,v):上下级的代价目标函数, (u~t,u~t)∈U×V:上级的期望结局, 相似文献

9.

一种新的多目标优化策略机制及其应用

柴玉梅张靖《计算机应用》2007,27(9):2287-2289

在博弈问题中很多学习机制只能使Agent收敛到Nash均衡解,不能很好地满足实际需要。将博弈问题转化为多目标优化问题,提出了一种新的多目标优化策略机制——保留受控策略机制,并将其应用到囚徒困境问题中得到比Nash均衡更有意义的Pareto最优解,在自博弈实验中取得了较高的满意度。实验结果表明,该策略机制求解Pareto最优解的有效性。相似文献

10.

足球机器人多智能体协作策略 总被引：12，自引：0，他引：12

钟碧良张祺杨宜民《计算机工程与应用》2003,39(24):60-63

文章提出了足球机器人多智能体系统协作策略,它由三部分组成:角色执行器、角色分配器和避撞任务处理器。机器人角色分为进攻、防守和守门。角色任务处理器决定每一角色运动到何位置。角色分配器在每个采样周期中,根据视觉信息,动态地改变每一机器人的角色。避撞任务处理器预测两个机器人相撞的可能性,并改变机器人目标位置以避免碰撞。角色任务执行器执行由4阶bezier曲线产生运动轨迹。带有PID控制的足球机器人跟踪确定的bezier曲线。该文提出的策略已成功应用到GDUT_TAIYI队。相似文献

11.

一类防从方威胁的非线性鼓励策略

高立群《控制与决策》1992,7(4):313-317,305

相似文献

12.

融合多种策略的改进粒子群算法

胡佳《计算机系统应用》2021,30(7):172-177

为有效解决粒子群优化算法(Particle Swarm Optimization, PSO)容易陷入局部极值及进化后期收敛速度慢、精度低等缺点, 提出了一种融合多种策略的改进粒子群算法(Improved Particle Swarm Optimization, IPSO). 该算法包括以下4点改进:(1)采取分组控制策... 相似文献

13.

基于纳什均衡的多用户分布式系统负载均衡的研究

王龙田野《软件》2012,33(12)

本文在基于排队论M/M/1动态负载均衡模型的基础上,提出了一种基于纳什均衡的动态负载均衡和静态负载均衡相结合的负载均衡方案.将改进后的方法与原负载均衡模型作对比,结果表明,在系统高通信开销时,新方案能有较好的性能表现,当系统负载量超过45％时,可以取得较好的期望响应时间. 相似文献

14.

仿人机器人站立多平衡策略控制

邢登鹏刘旭《自动化学报》2011,37(2):228-233

设计了全状态反馈参数化控制器用于仿人机器人在站立平衡中应对外界冲击力与持续力. 采用多个机器人模型模仿人类站立平衡中的多个应对策略. 对每个模型, 设计了参数控制器作用于每一个状态误差, 并针对不同的作用力大小、方向和位置优化控制器参数. 应对不同外界作用力展现了该控制器的性能. 通过比较每一个策略处理干扰力的能力, 本文也探索了每个关节在站立平衡中的作用. 相似文献

15.

Noncooperative Model Predictive Game With Markov Jump Graph

下载免费PDF全文

Yang Xu Yuan Yuan Zhen Wang Xuelong Li 《IEEE/CAA Journal of Automatica Sinica》2023,10(4):931-944

In this paper,the distributed stochastic model predictive control(MPC) is proposed for the noncooperative game problem of the discrete-time multi-player systems(MPSs) with the undirected Markov jump graph.To reflect the reality,the state and input constraints have been considered along with the external disturbances.An iterative algorithm is designed such that model predictive noncooperative game could converge to the socalled ε-Nash equilibrium in a distributed manner.Sufficient conditions are ... 相似文献

16.

Simultaneous Independent Online Auctions with Discrete Bid Increments 总被引：1，自引：0，他引：1

Vipul?Bansal Email author Rahul?Garg 《Electronic Commerce Research》2005,5(2):181-201

Decentralized multi-item auctions offer great opportunities for integrating fragmented online auction markets into larger markets with more efficient outcomes. This paper extends the theory of multi-item ascending auctions of substitutes by considering any finite positive bid increment and allowing the bidders to bid asyn-chronously instead of bidding in a round-robin fashion. We consider a setup where the bidders utilities over multiple items are additive and bound the maximum inefficiency in the allocation when the bidders follow a simple greedy strategy. We also obtain the limits within which the prices of individual items can vary from one outcome to another. For the special case of single unit bidder demand, we also bound the maximum surplus which a bidder can extract by unilaterally switching to some other strategy. The paper suggests an upper bound for the minimum required bid increment which would be necessary for competitive price discovery and truthful bidding in a practical online implementation.The work was done while the author was with IBM Research. 相似文献

17.

单机调度的非合作博弈建模与分析 总被引：4，自引：0，他引：4

王长军席裕庚《自动化学报》2005,31(4):516-522

footnotesize Considering the independent optimization requirement for each demander of modern manufacture, we explore the application of noncooperative game in production scheduling research, and model scheduling problem as competition of machine resources among a group of selfish jobs. Each job has its own performance objective. For the single machine, multi-jobs and non-preemptive scheduling problem, a noncooperative game model is established. Based on the model, many problems about Nash equilibrium solution, such as the existence, quantity, properties of solution space, performance of solution and algorithm are discussed. The results are tested by numerical example. 相似文献