共查询到17条相似文献,搜索用时 71 毫秒
1.
2.
3.
4.
从方具有多目标的仿射型诱导策略研究 总被引:1,自引:0,他引:1
本文讨论当从方具有多个目标,主方对从方的诱地策略设计问题,给出了最优诱导策略和可诱导域的定义,研究了仿射型诱导策略的存在条件及解的结构形式,并探讨了当主方只具有对从方决策的部分观测时的诱导问题。 相似文献
5.
受检测器和诱导信息板显示形式的限制,诱导信息更新周期通常较长。为此,根据备选路径交通状态而非行驶时间制定诱导策略,利用交通状态相对稳定的特点,进一步提出状态反馈诱导策略;为减少长周期与时变交通需求间的矛盾及其他误差,提出了状态与时间反馈策略相结合的混合策略。仿真实验表明,面对长周期时,状态反馈策略可以满足稳定性和准确性的双重要求,混合策略则进一步提高了诱导的准确性。 相似文献
6.
不确定性下非合作博弈强Nash均衡的存在性 总被引:2,自引:0,他引:2
在已知不确定参数变化范围的假设下,研究了非合作博弈强Nash均衡的存在性问题.基于经典非合作博弈的强Berge均衡及帕雷托均衡的概念,结合非合作博弈NS均衡,定义了不确定性下非合作博弈的帕雷托强Berge和强Nash均衡的概念,并借助Ky Fan不等式证明其存在性.最后利用算例验证了其可行性和有效性. 相似文献
7.
8.
一、引言诱导问题的基本要素可记为 u,U(?)R~m:上级的决策变量与决策空间, v,V(?)R~n:下级的决策变量与决策空间, J_0(u,v),J_1,(u,v):上下级的代价目标函数, (u~t,u~t)∈U×V:上级的期望结局, 相似文献
9.
在博弈问题中很多学习机制只能使Agent收敛到Nash均衡解,不能很好地满足实际需要。将博弈问题转化为多目标优化问题,提出了一种新的多目标优化策略机制——保留受控策略机制,并将其应用到囚徒困境问题中得到比Nash均衡更有意义的Pareto最优解,在自博弈实验中取得了较高的满意度。实验结果表明,该策略机制求解Pareto最优解的有效性。 相似文献
10.
足球机器人多智能体协作策略 总被引:12,自引:0,他引:12
文章提出了足球机器人多智能体系统协作策略,它由三部分组成:角色执行器、角色分配器和避撞任务处理器。机器人角色分为进攻、防守和守门。角色任务处理器决定每一角色运动到何位置。角色分配器在每个采样周期中,根据视觉信息,动态地改变每一机器人的角色。避撞任务处理器预测两个机器人相撞的可能性,并改变机器人目标位置以避免碰撞。角色任务执行器执行由4阶bezier曲线产生运动轨迹。带有PID控制的足球机器人跟踪确定的bezier曲线。该文提出的策略已成功应用到GDUT_TAIYI队。 相似文献
11.
12.
为有效解决粒子群优化算法(Particle Swarm Optimization, PSO)容易陷入局部极值及进化后期收敛速度慢、精度低等缺点, 提出了一种融合多种策略的改进粒子群算法(Improved Particle Swarm Optimization, IPSO). 该算法包括以下4点改进:(1)采取分组控制策... 相似文献
13.
本文在基于排队论M/M/1动态负载均衡模型的基础上,提出了一种基于纳什均衡的动态负载均衡和静态负载均衡相结合的负载均衡方案.将改进后的方法与原负载均衡模型作对比,结果表明,在系统高通信开销时,新方案能有较好的性能表现,当系统负载量超过45%时,可以取得较好的期望响应时间. 相似文献
14.
设计了全状态反馈参数化控制器用于仿人机器人在站立平衡中应对外界冲击力与持续力. 采用多个机器人模型模仿人类站立平衡中的多个应对策略. 对每个模型, 设计了参数控制器作用于每一个状态误差, 并针对不同的作用力大小、方向和位置优化控制器参数. 应对不同外界作用力展现了该控制器的性能. 通过比较每一个策略处理干扰力的能力, 本文也探索了每个关节在站立平衡中的作用. 相似文献
15.
In this paper,the distributed stochastic model predictive control(MPC) is proposed for the noncooperative game problem of the discrete-time multi-player systems(MPSs) with the undirected Markov jump graph.To reflect the reality,the state and input constraints have been considered along with the external disturbances.An iterative algorithm is designed such that model predictive noncooperative game could converge to the socalled ε-Nash equilibrium in a distributed manner.Sufficient conditions are ... 相似文献
16.
Decentralized multi-item auctions offer great opportunities for integrating fragmented online auction markets into larger markets with more efficient outcomes. This paper extends the theory of multi-item ascending auctions of substitutes by considering any finite positive bid increment and allowing the bidders to bid asyn-chronously instead of bidding in a round-robin fashion. We consider a setup where the bidders utilities over multiple items are additive and bound the maximum inefficiency in the allocation when the bidders follow a simple greedy strategy. We also obtain the limits within which the prices of individual items can vary from one outcome to another. For the special case of single unit bidder demand, we also bound the maximum surplus which a bidder can extract by unilaterally switching to some other strategy. The paper suggests an upper bound for the minimum required bid increment which would be necessary for competitive price discovery and truthful bidding in a practical online implementation.The work was done while the author was with IBM Research. 相似文献
17.
单机调度的非合作博弈建模与分析 总被引:4,自引:0,他引:4
footnotesize Considering the independent optimization requirement for each demander of modern manufacture, we explore the application of noncooperative game in production scheduling research, and model scheduling problem as competition of machine resources among a group of selfish jobs. Each job has its own performance objective. For the single machine, multi-jobs and non-preemptive scheduling problem, a noncooperative game model is established. Based on the model, many problems about Nash equilibrium solution, such as the existence, quantity, properties of solution space, performance of solution and algorithm are discussed. The results are tested by numerical example. 相似文献