共查询到20条相似文献,搜索用时 203 毫秒
1.
部分可观察马尔可夫决策过程在策略空间和状态空间上的计算复杂性,使求解其一个最优策略成为NP-hard难题.为此,提出一种动态影响图模型来建模不确定环境下的Agent动态决策问题.动态影响图模型以有向无环图表示系统变量之间的复杂关系.首先,动态影响图利用动态贝叶斯网络表示转移模型和观察模型以简化系统的状态空间;其次,效用函数以效用结点的形式清晰地表示出来,从而简化系统效用函数的表示;最后,通过决策结点表示系统的行为来简化系统的策略空间.通过实例从3个方面和POMDP模型进行了比较,研究的结果表明,动态影响图模型为大型的POMDP问题提供了一种简明的表示方式,最后在Robocup环境初步验证了该模型. 相似文献
2.
基于图文法的动态软件体系结构支撑环境 总被引:6,自引:0,他引:6
使用类型化的属性图及其图文法来直观而形式地刻画软件体系结构和体系结构风格,用图转换来刻画动态体系结构的重配置行为.基于这种刻画,构建了一个动态软件体系结构支撑环境.该环境一方面,通过一个基于图文法的编辑器来支持体系结构图模型的可视化构造和操纵;另一方面,基于内置运行时体系结构技术实现了体系结构图模型在具体系统中的物理实施,并使得图模型上的图转换操作可以自动映射到实际系统的动态重配置上.再加上一系列的辅助设施,形成了一个较为完整的基于图文法的动态软件体系结构支撑环境. 相似文献
3.
在复杂的实时软件系统中使用构件式设计方法,已成为目前软件工程中的研究热点.如何有效地验证实时软件的设计是否满足给定的时间规约,是实时计算领域中的主要挑战之一.通过在接口自动机模型中添加时间区间标记,来扩展其对实时系统接口行为的表达能力;使用实时接口自动机网络来描述实时软件系统的构件式设计模型;使用带布尔不等式时间约束的UML顺序图表示基于场景的需求规约,对系统设计阶段实时软件构件的动态行为进行形式化分析与检验.通过对实时接口自动机网络状态空间的分析,构造了其可兼容的整型状态等价类空间的可达图,并在此基础上给出了验证算法,以检验构件式实时软件系统的设计与带时间约束的场景式规约之间的一致性. 相似文献
4.
针对现有基于视频整体时间结构建模的行为识别方法中,存在的时间噪声信息和歧义信息干扰现象,从而引起行为类别识别错误的问题,提出一种新型的Grenander推理优化下时间图模型(temporal graph model with Grenander inference, TGM-GI).首先,构建3D CNN-LSTM模块,其中3D CNN用于行为的动态特征提取, LSTM模块用于该特征的时间依赖关系优化.其次,在深度模块基础上,利用Grenander理论构建了行为识别的时间图模型,并设计了两个模块分别处理慢行为时间冗余和异常行为干扰问题,实现了时间噪声抑制下的时间结构提议.随后,设计融合特征约束和语义约束的Grenander测度,并提出一种时序增量形式的Viterbi算法,修正了行为时间模式中的歧义信息.最后,采用基于动态时间规划的模式匹配方法,完成了基于时间模式的行为识别任务.在UCF101和Olympic Sports两个公认数据集上,与现有多种基于深度学习的行为识别方法进行比较,该方法获得了最好的行为识别正确率.该方法优于基准的3D CNN-LSTM方法,在UCF101数据集上识别... 相似文献
5.
6.
7.
针对UML活动图在生成故障树的过程中只能反映活动事件流故障导致的系统失效,不能反映系统静态状态故障的问题,提出了一种活动图结合类图生成故障树的方法。在原有活动图的基础上,使用类图增加系统静态状态信息,设计活动图和类图到故障树模型的转换规则,将活动图中动态行为信息和类图静态状态信息转化为故障树中的节点要素。基于转换规则设计算法逆向遍历活动图和类图,自顶向下生成故障树。经过实例建模生成故障树,表明该方法能反映系统的动态行为和静态状态两方面的故障信息,为故障树生成提供了一种新的有效途径。 相似文献
8.
将基于攻击图的脆弱性评估技术和动态网络演化分析相结合,提出了一种动态攻击网络演化与分析模型。该模型首先借鉴演变图的思想将攻击图拓展为随时间域和空间域同时变化的演变攻击图,在子图相似度定义的基础上构建攻击演化模式,分析模式内暂态变化的同时结合时序数据分析模式间的连接变化,以攻击演变挖掘算法为核心的模型应用分析过程可以确定整个过程中攻击模式的数量,明晰每个模式的典型攻击结构,实例证明本文提出的模型和方法可以有效地模拟攻击发生的过程,当需要防御手段进行干预时,可有针对性的选择危害大的阶段或者节点来抑制攻击过程的发生 相似文献
9.
10.
传统的道路转向延迟对偶图表达法缺乏对交通网络时间依赖特性的考虑,不适合动态路径规划问题的求解。本文将时间因素引入到对偶图中,发展了一种动态对偶图模型,将交通路网表达为动态对偶网络,并为之定义了FIFO(先进先出)条件,推导了满足FIFO条件的动态行程计算方法,设计了时间依赖的标号设定最短路径算法。实验结果表明,利用该对偶图模型和动态对偶网络,能有效表达路网转向延迟,在以出行时间为标准的动态路径规划中,基于动态对偶网络的路径规划结果可节省约16%的出行时间。 相似文献
11.
Prashant Doshi Yifeng Zeng Qiongyu Chen 《Autonomous Agents and Multi-Agent Systems》2009,18(3):376-416
We develop new graphical representations for the problem of sequential decision making in partially observable multiagent environments, as formalized by interactive partially observable Markov decision processes (I-POMDPs). The graphical models
called interactive influence diagrams (I-IDs) and their dynamic counterparts, interactive dynamic influence diagrams (I-DIDs), seek to explicitly model the structure that is often present in real-world problems by decomposing the situation into chance
and decision variables, and the dependencies between the variables. I-DIDs generalize DIDs, which may be viewed as graphical
representations of POMDPs, to multiagent settings in the same way that I-POMDPs generalize POMDPs. I-DIDs may be used to compute
the policy of an agent given its belief as the agent acts and observes in a setting that is populated by other interacting
agents. Using several examples, we show how I-IDs and I-DIDs may be applied and demonstrate their usefulness. We also show
how the models may be solved using the standard algorithms that are applicable to DIDs. Solving I-DIDs exactly involves knowing
the solutions of possible models of the other agents. The space of models grows exponentially with the number of time steps.
We present a method of solving I-DIDs approximately by limiting the number of other agents’ candidate models at each time
step to a constant. We do this by clustering models that are likely to be behaviorally equivalent and selecting a representative
set from the clusters. We discuss the error bound of the approximation technique and demonstrate its empirical performance. 相似文献
12.
定位2运输路线安排问题的两阶段启发式算法 总被引:24,自引:1,他引:24
重点研究了集成化物流中一类特殊的定位一运输路线安排问题(LRP)的解决方法.LRP问题包括设施定位和运输路线优化两方面决策,属于NP-hard难题.由于问题的复杂性,提出基于假设前提的LRP模型及其两阶段启发式求解算法.该方法分两步实现:首先,采用基于最小包络聚类分析的启发式方法确定被选择的潜在设施及由每一个选中的设施所要提供服务的客户群;其次,运用带有控制开关的遗传算法求解每一确定客户类中的优化运输路线.提出利用两阶段启发式算法求解LRP问题,此方法实现容易、运算简单,一定程度上避免了遗传算法中的“局部最优现象”.仿真实验证明了该算法求解单目标LRP的有效性和准确性. 相似文献
13.
针对原始动态自适应差分进化(SADE)算法局部搜索能力弱和寻优精度低的问题,提出一种求解动态优化问题的邻域搜索差分进化(NSDE)算法。通过引入邻域搜索机制,在划分种群最优个体的邻域空间范围内产生候选解,选取候选解集合中的最优解并对种群最优个体进行迭代,增强算法局部搜索能力。在传统基于距离的排斥方案中,引入hill-valley函数追踪邻近峰,提高算法寻优精度。实验结果表明,与SADE、人工免疫网络动态优化、多种群竞争差分进化和改进差分进化算法相比,NSDE算法在49个测试问题中分别有28、38、29和38个测试问题的平均误差更小,综合性能表现更好。 相似文献
14.
When attempting to solve multiobjective optimization problems (MOPs) using evolutionary algorithms, the Pareto genetic algorithm
(GA) has now become a standard of sorts. After its introduction, this approach was further developed and led to many applications.
All of these approaches are based on Pareto ranking and use the fitness sharing function to keep diversity. On the other hand,
the scheme for solving MOPs presented by Nash introduced the notion of Nash equilibrium and aimed at solving MOPs that originated
from evolutionary game theory and economics. Since the concept of Nash Equilibrium was introduced, game theorists have attempted
to formalize aspects of the evolutionary equilibrium. Nash genetic algorithm (Nash GA) is the idea to bring together genetic
algorithms and Nash strategy. The aim of this algorithm is to find the Nash equilibrium through the genetic process. Another
central achievement of evolutionary game theory is the introduction of a method by which agents can play optimal strategies
in the absence of rationality. Through the process of Darwinian selection, a population of agents can evolve to an evolutionary
stable strategy (ESS). In this article, we find the ESS as a solution of MOPs using a coevolutionary algorithm based on evolutionary
game theory. By applying newly designed coevolutionary algorithms to several MOPs, we can confirm that evolutionary game theory
can be embodied by the coevolutionary algorithm and this coevolutionary algorithm can find optimal equilibrium points as solutions
for an MOP. We also show the optimization performance of the co-evolutionary algorithm based on evolutionary game theory by
applying this model to several MOPs and comparing the solutions with those of previous evolutionary optimization models.
This work was presented, in part, at the 8th International Symposium on Artificial Life and Robotics, Oita, Japan, January
24#x2013;26, 2003. 相似文献
15.
16.
遗传算法中排列问题的编码研究 总被引:4,自引:1,他引:4
针对排列问题的编码方法一直是遗传算法应用中的重要研究领域。采用各种传统编码方法的编码表示空间通常远远大于实际的问题空间,这不但提高了各算子设计的复杂性,同时很大程度上降低了收敛速度。文章提出了一种针对排列问题基于次序的一维二进制编码方案和两种改良方案,使排列与编码形成了一一映射,最大限度地缩小了编码表示空间与问题空间的差距。采用TSP问题的实验结果表明,文章提出的编码方式具有很好的性能。 相似文献
17.
18.
#SAT在人工智能领域取得了广泛应用,很多现实问题可以规约成#SAT进行求解,得到命题理论的模型个数.通过对基于扩展规则的#SAT求解器的深入研究,发现选择规约子句的顺序对极大项空间的大小有着较大的影响,因此提出两种加速#SAT求解的启发式策略:MW和LC&MW.MW每次选择具有最大权值的子句作为规约子句;LC&MW每次选择最长子句作为规约子句,若最长子句存在多个,则在多个最长子句中选择具有最大权值的子句作为规约子句.利用MW策略设计了算法CER_MW,利用LC&MW策略设计了算法CER_LC&MW.实验结果表明,CER_MW和CER_LC&MW相对于先前的#SAT求解算法在求解效率和求解能力上都有显著的提高.在求解效率方面,CER_MW和CER_LC&MW的求解速度是其他算法的1.4倍~100倍.在求解能力方面,CER_MW和CER_LC&MW在限定时间内可解的测试用例更多. 相似文献
19.
稀疏矩阵向量乘(SpMV)是求解稀疏线性方程组的计算核心,被广泛应用在经济学模型、信号处理等科学计算和工程应用中,对于SpMV及其调优技术的研究有助于提升解决相关领域问题的运算效率。传统SpMV自动调优方法基于硬件平台的体系结构参数设置来提升SpMV性能,但巨大的参数设置量导致搜索空间变大且自动调优耗时大幅增加。采用深度学习技术,基于卷积神经网络,构建由双通道稀疏矩阵特征融合以及稀疏矩阵特征与体系结构特征融合组成的SpMV运算性能预测模型,实现快速自动调优。为提高SpMV运算时间的预测精度,选取特征数据并利用箱形图统计SpMV时间信息,同时在佛罗里达稀疏矩阵数据集上进行实验设计与验证,结果表明,该模型的SpMV运算时间预测准确率达到80%以上,并且具有较强的泛化能力。 相似文献