共查询到19条相似文献,搜索用时 93 毫秒
1.
提出了一个基于网络划分和分布式并行运算的P/G网快速验证方法.对于各子网运算,采用带加速子网运算策略的Cholesky分解法;并根据各个子网运算相互独立的特点,采用基于MPI(Message Passing Interface)的并行结构对子网络运算进行分布式并行运算.实验证明,该快速验证方法在运算时间和内存占用上效果十分良好. 相似文献
2.
近年来电子设计自动化(EDA)研究人员尝试利用图形处理器(graphic processing unit,GPU)提供的高性能计算能力对IC参数分析进行加速研究.为了利用GPU进行电源线/地线网络(power/ground network,P/G网)快速分析,设计了一种基于经典的连续过松弛(successive over-relaxation,SOR)算法的高效P/G网分析并行算法.基于GPU并行计算加速原理,此算法进行了如下改进:1)采用红-黑次序的松弛策略.将所有的节点分为红黑两类,红色节点的所有邻点只有黑色节点、黑色节点的所有邻点只有红色节点,红色节点与黑色节点交替松弛,保证了GPU并行计算中的数据一致性.对于具有N个节点的P/G网而言,一次红色节点或黑色节点松弛可以同时对N/2个节点进行松弛操作,即理论上可以同时启动N/2个并行线程.2)优化数据结构.实现了对数据空间的合并访问,以保证对GPU全局存储空间的最优访问.3)在共享存储器内通过并行归约对松弛标记进行快速统计,同时利用zero-copy技术进行松弛标记的快速拷贝,以快速决定是否继续松弛.大量的实验结果表明:与单线程的CPU程序相比,此算法的加速倍数随GPU所提供物理线程的数目增加而线性增加,可以获得最大242倍的加速效果,是目前EDA研究领域中加速效果最好的GPU算法. 相似文献
3.
4.
可靠性是可信性研究的基本内涵之一,也是P2P ( Peer-to-Peer)存储系统研究的关键。P2P存储系统结点具有高动态特征,结点频繁地上下线给系统的可靠性分析带来困难。结点的暂时离线会增加副本数量,从而导致系统不必要的损耗。较多的副本数量会增加系统的可靠性,但是同时会导致系统的一致性维护成本增加。而较少的副本数量又会导致系统的可靠性显著降低。针对副本的数量和可靠性之间的关系,采用随机Pctri建立了P2P存储系统的可靠性模型并加以分析,围绕数据可靠性度量要求和数据副本的数量建立关系模型,从理论上指明研究系统可靠性的目的和基本原则,这可以在系统组建之初帮助优化系统的设计。 相似文献
5.
基于P/T系统化简方法的工作流过程模型验证 总被引:4,自引:0,他引:4
目前工作流技术在管理、生产和科学研究等领域中已经被广泛应用.由于过程逻辑的复杂性和变化性等原因,如何建立良构的业务过程是一个比较现实的问题.因此,对过程模型进行分析和优化成为工作流技术的研究方向之一.首先,根据改进的工作流过程元模型,研究并提出了一种基于P/T系统的工作流过程模型过程网.基于过程网给出了一组化简规则,用于验证过程模型中的死锁和乏同步两种结构冲突.最后,结合一个业务过程实例,根据转换规则把它映射为过程网,应用规则进行化简并得到验证结果. 相似文献
6.
7.
无线自组网常常采用分簇网络结构来改善网络性能,并且大都是非交叠分簇结构.首先,比较了交叠分簇结构和非交叠分簇结构的优缺点.然后,重点对交叠分簇网络结构的特性进行了研究,特别考虑了相邻簇之间的高效通信问题.最后,通过模拟实验分析了交叠分簇策略下几种典型分簇算法的性能,验证了算法的有效性. 相似文献
8.
利用高效的建模技术来构建复杂的业务流程,一方面可以提高模型形式化表示的可读性,另一方面便于进行模型性能分析,确保模型在投入使用后的正确性。阐述了利用Petri网技术的严格语义,来构建流程模型并进行性能分析的过程。首先指出时间性能对工作流性能分析的重要性,然后介绍了Petri网和工作流网的定义、工作流基本路由结构的Petri网表示,及其对应的性能等价公式,最后在这些基本定理的基础上,通过一个购车流程的实例来构建模型,并对其时间性能进行分析,证明了利用Petri网技术建模的合理性和优越性。 相似文献
9.
基于联通4G 与LTE 技术的配套传输光纤网络建设发挥着重要基础作用,其所具有的频带宽、损耗低、重量轻、
抗干扰性强以及保真度高等优势使得4G 网络能够充分发挥出自身的服务性能。本文从联通4G、LTE 网络技术概述着手,对
其配套传输光缆网的建设进行分析,以期提供可借鉴价值。 相似文献
10.
受限于计算能力,在现有的电热分析研究中,无法考虑电压变化对电热分析的影响,从而降低了分析的精度.基于已有的研究成果,文中分析了芯片的功耗/电压/温度分布向量之间的相互关系,指出了在电热综合分析中考虑电压/温度变化的必要性,进而提出了一种迭代式的并行电热综合分析方法ETA_VT,该方法基于功耗与电压/温度之间的递归关系,进行迭代计算,最后将收敛后的功耗/电压/温度分布向量作为求解结果同时输出.基于多核CPU+众核GPU异构计算机系统所提供的并行计算资源,为了提高电热综合分析的运行效率,文中不仅设计了一个具有主辅双进程的ETA VT算法流程,而且还分别采用CPU多线程并行计算、GPU并行计算、CPU+GPU协同并行计算技术对ETA_VT算法进行加速研究.实验数据表明:(1)考虑电压/温度变化的电热综合分析不仅可以获得较为精确的分析结果,而且可以同时计算出芯片的功耗/电压/温度分布;(2)采用并行计算技术、并合理分配计算资源,不仅可以解决电热综合分析中存在的功耗/电压/温度多参量相互影响的问题,而且还可以有效地提高电热综合分析的速度,获得多达44倍的加速效果.文中工作是将高性能计算引入电子设计自动化(EDA)算法研究的一次有益尝试,表明高性能计算技术不仅可以提高EDA算法的执行效率,而且可以促进芯片设计中存在的多参量相互影响综合分析问题的研究和解决. 相似文献
11.
随着集成电路工艺进入纳米时代,供电电压波动严重影响电路性能.制造中通孔对位不准,及运行中铜导线电迁移现象.都会在电源线/地线网络(P/G网)中产生大量潜在的开路故障,并使供电电压发生明显波动.为了在测试中对大量的开路故障进行快速测试.迫切需要提高故障分析的算法效率.为此,首次提出了单故障连续过松弛算法(SD-SOR),对发生单开路电阻故障的P/G网节点电压分布进行快速分析.基于无故障P.G网节点电压分布,SD-SORR对开路电阻周围受故障影响比较大的少数节点进行松弛计算.与传统的全局SOR方法相比,SD-SOR具有如下3个优点:1)局部松弛.由于电路中只有一个电阻口发生开路故障.SD-SOR不是采用全局电路节点的顺序松弛方法,而是采用从故障q所连的节点不断向周围节点进行松弛的波状松弛方法,当某些节点的IR电压降变化小于一个极小的设定值时.这些节点就不再向外进行松弛计算.2)高效.与传统的全局SOR方法相比.SD-SOR不仅参与松弛的节点非常少.而且松弛次数也有明显减少.3)高精度.与传统的全局SOR方法相比,由于距离故障比较远,电路中绝大多数节点电压变化非常小,所以SD-SOR只需对距离故障比较近的节点进行松弛计算,就能够保持较高的分析精度.大量的实验数据表明:与预条件全局SOR求解方法相比,SD-SOR在保持较高精度(误差小于0.95%)的前提下,速度可以提高57倍. 相似文献
12.
In this paper, we consider the problem of finding fill-preserving sparse matrix orderings for parallel factorization. That is, given a large sparse symmetric and positive definite matrix A that has been ordered by some fill-reducing ordering, we want to determine a reordering that is appropriate in terms of preserving the sparsity and minimizing the cost to perform the Cholesky factorization in parallel. Past researches on this problem all are based on the elimination tree model, in which each node represents the task for factoring a column, and thus, can be seen as a coarse-grained task dependence model. To exploit more parallelism, Joseph Liu proposed a medium-grained task model, called the column task graph, and showed that it is amenable to the shared-memory supercomputers. Based on the column task graph, we devise a greedy reordering algorithm, and show that our algorithm can find the optimal ordering among the class of all fill-preserving orderings of the given sparse matrix A. 相似文献
13.
挖掘数据网络中有价值的、具有稳定性的社区,对网络信息的获取、推荐及网络的演化预测具有重要的价值。针对现有异质网络聚类方法难以在同一维度有效整合网络中异质信息的问题,提出了一种基于图正则化非负矩阵分解的异质网络聚类方法。通过加入图正则项,将中心类型子空间和属性类型子空间的内部连接关系作为约束项,引入到非负矩阵分解模型中,从而找到高维数据在低维空间的紧致嵌入,成功消除了异质节点之间的部分噪声,同时,对反映不同子网络共有潜在结构的共识矩阵进行优化,有效整合异质信息,并且在降维过程中较大限度地保留了异质信息的完整性,提高了异质网络聚类方法的精度,在真实世界数据集上的实验结果也验证了该方法的有效性。 相似文献
14.
提出了一种高效的、针对VLSI中Mesh拓扑结构的RLC电源线/地线网络的时域分析算法,该算法首次利用一种基于启发式原则的电路模型的简化方法来缩小电路网络的规模,扩展了原有的几何多网格方法来模拟求解以RLC元件建模的电源线网络.实验数据表明,对于一些规模较大的电路实例,在一个较小的误差损失下,该算法能大幅缩小电路的求解规模,求解速度比SPICE快两个数量级以上,比原有的几何多网格方法也有大幅的提高.如在Sun工作站上,当误差控制在1.5%时,模拟求解一个百万节点的电路网络仅仅需要半个小时. 相似文献
15.
介绍一种基于随机行走方法与松弛迭代(SOR)算法相结合的快速电源网络求解方法,它先将P/G网分为若干块,然后用简化的随机行走方法求取电路块边界结点的电压,最后采用松弛迭代算法求出电路块内部结点的电压.同时还给出了一种电路块从对角顶点向中央求解的策略,并将此方法推广到采用RLC瞬态网络的求解.大量的实验数据表明,受限于P/G网供电PAD的数目较少这一现实,随机行走方法的效率比较低,在此情形下,该方法比随机行走方法快20倍. 相似文献
16.
The incomplete Cholesky (IC) factorization preconditioning technique is applied to the Krylov subspace methods for solving large systems of linear equations resulted from the use of edge-based finite element method (FEM). The construction of the preconditioner is based on the fact that the coefficient matrix is represented in an upper triangular compressed sparse row (CSR) form. An efficient implementation of the IC factorization is described in detail for complex symmetric matrices. With some ordering schemes our IC algorithm can greatly reduce the memory requirement as well as the iteration numbers. Numerical tests on harmonic analysis for plane wave scattering from a metallic plate and a metallic sphere coated by a lossy dielectric layer show the efficiency of this method. 相似文献
17.
Modeling and Analysis of Mesh Tree Hybrid Power/Ground Networks with Multiple Voltage Supply in Time Domain 下载免费PDF全文
Yi-CiCai JinShi Zu-YingLuo Xian-LongHong 《计算机科学技术学报》2005,20(2):0-0
This paper proposes a novel algorithm, which can be used to model and analyze mesh tree hybrid power/ground distribution networks with multiple voltage supply in time domain. Not only this algorithm enhances common method's ability on analysis of power/ground network with irregular topology, but also very high accuracy it keeps. The accuracy and stability of this algorithm is proved using strict math method in this paper. Also, the usage of both precondition technique based on Incomplete Choleskey Decomposition and fast variable elimination technique has improved the algorithm's efficiency a lot. Experimental results show that it can finish the analysis of power/ground network with enormons size within very short time. Also, this algorithm can be applied to analyze the clock network, bus network, and signal network without buffer under high working frequency because of the independence of the topology. 相似文献
18.
作为一种典型的网络大数据,社交信息网络如微博、Tweeter等,不仅包含用户间复杂的网络结构,而且包含大量用户所发表的微博/Tweet信息.现有链路预测算法大多只利用单方面的网络拓扑信息或非拓扑信息,仍然缺乏有效融合社交信息网络中拓扑与非拓扑信息的链路预测方法.为此,从社交信息网络中用户的主题角度出发,提出一种融合主题相似信息的链路预测方法.首先基于用户文本内容抽取用户的主题表示,并定义用户间的主题相似度;然后基于用户主题相似度,构建了一种用户主题相似稀疏网络;进一步将用户主题相似网络与用户间关注/被关注网络融合在统一的概率矩阵分解框架下,通过学习获得用户的潜在特征表示和网络链路参数;最终在此概率矩阵分解框架下,基于用户的潜在特征表示和链路参数计算得到用户间的链路可能性.所提出的模型提供了一种融合多种网络信息的通用策略和学习方法.实验在包含网络结构与文本信息的4组微博与推特数据集中显示,所提出的融合概率矩阵分解链路方法相比其他链路预测方法更有效. 相似文献