共查询到19条相似文献,搜索用时 46 毫秒
1.
介绍PC机群计算环境下的电力系统潮流计算模型,结合基于节点分割的网络分块方法和PC机群环境的特点,提出了一种基于网络数学分割的电力系统潮流分解协调算法.测试结果表明此算法具有较高的加速度和计算精度,适合在网络计算环境中实现. 相似文献
2.
更实际的异构并行计算模型 总被引:3,自引:1,他引:3
通过结合多种代表性并行计算模型,给出异构环境中的HBSP模型和程序开销计算方法。采用基于消息长度的线性模型具有通信开销的计算更精确、程序和算法在异构环境中的设计灵活、且可解除原有BSP模型对h-relation的限制等优点。当构成BSP计算机的各处理机速度相同且原有BSP算法达到最优(即各处理机上所分配的计算量与通信量完全均衡)时,HBSP模型等同于原有模型。 相似文献
3.
4.
三对角线性方程组的分布式并行算法 总被引:4,自引:1,他引:4
文中回顾了Michielse&Vorst算法,分析了影响M&V.算法并行效率的主要因素,根据分布治之思想提出了一种求解三对角方程组的并行算法,新算法通信建立次数的M&V算法的50%,数据传输量为其33%,最后的工作站网络环境下实现了新算法,就并行效率与M&V算法进行了比较,结果表明在由6台工作站的组成的网络中新算法必能提高可达到40%。 相似文献
5.
6.
高性能网络并行计算模型LogP的剖析 总被引:5,自引:0,他引:5
戴梅萼 《小型微型计算机系统》2000,21(2):124-126
并行计算模型是设计和分析并行算法的基础和关键,在实现高性能网络计算中起重要作用。LogP是一个面向高性能并行计算的现实模型,它可以用来作为的,可移植的并行算法的基础,这个模型基于四个参数,即。L,o,g,P.这些参数反映了高性能网络并行计算的计算带宽,通信带宽,通信延迟,以及传输和计算的结合效率. 相似文献
7.
矩阵相乘Cannon并行算法在工作站机群上的实现 总被引:6,自引:1,他引:6
矩阵相乘Cannon并行算法是一个基于分布式存储多处理机模型的并行数据算法,文章研究了它在工作站机群上的实现。在满足负载平衡和减少网络间数据传输的条件下,主要探讨了子任务在工作站上的优化分配策略,最后给出了在PVM并行编程环境下的具体实现方法。 相似文献
8.
大规模并行计算机的出现和发展迫切要求有新的并行处设计理论和技术来指导更实际的并行算法的设计。本文首先简单介绍了针对MPC提出孤LogP和Barrier-LogP并行计算模型,然后借助于Barrier-LogP模型从通信平衡、数据分配和重叠通信与计算这三个方面讨论了更实际的并行算法设计的一般方法和技巧。 相似文献
9.
并行计算模型LogGP的相关剖析 总被引:1,自引:0,他引:1
LogGP模型是LogP并行计算模型的扩展,它通过将基本的LogP模型同长消息处理相结合,使得算法设计能更好的发挥并行机的效率,提高运行性能。本文将针对LogGP模型做一简要的分析。 相似文献
10.
矩阵相乘Cannon并行算法在工作站机群上的实现 总被引:2,自引:0,他引:2
矩阵相乘Cannon并行算法是一个基于分布式存储多处理机模型的并行数值算法,本文研究了它在工作站机群上的实现。在满足负载平衡和减少网络间数据传输的条件下,主要探讨了子任务在工作站上的优化分析策略,最后给出了在pvm并行编程环境下的具体实现方法。 相似文献
11.
本文提出了基于同步无缓冲通信的多计算机系统的一种新的并行计算模型--SCMM模型,给出了其上的一些算法的优化设计例子,并在Transputer多机系统上设计和实现了图像重建里的ART算法。 相似文献
12.
《International Journal of Parallel, Emergent and Distributed Systems》2012,27(2):145-180
This paper introduces and discusses programming models for parallel processing and recent trends in the area of parallel programming. The paper discusses different parallel programming languages and tools that reflect various parallel computation models. These language differ in expressiveness, portability and performance. Software design and implementation largely varies by using different languages that make the programmer task easy or complex. We describe here the design goals and the main issues of parallel programming models and languages belonging to the following categories: shared-space based languages, message-based languages, parallel toolkits, data-parallel languages, parallel declarative languages, parallel object-oriented languages, and parallel composition-based languages. Tools and languages such as HPF, Linda, Java, OpenMP, PVM, MPI, Parallel C+ +, Sisal, Orca, Mentat, SkieCL, BSP and others are described in some detail. Their main features for design and implementation of high performance applications are discussed. Finally, we outline directions of research and development in the parallel programming area with a special attention to novel approaches based on high-level programming structures that make transparent to the users the architectural details of parallel computing machines. 相似文献
13.
尚月强 《计算机应用与软件》2008,25(9)
针对网络并行环境的计算能力强而通信相对较慢的实际情况,给出了一种局域网上求解线性方程组的并行Gauss-Seidel迭代算法.该算法将线性方程组的系数矩阵及右端项按行分块,然后将分块的系数矩阵及右端项按卷帘方式存储在各处理机,每次迭代通过循环传送已求出的部分解分量以减少处理机间的通信开销,提高并行算法的效率.试验结果表明该算法具有较高的并行效率和加速比. 相似文献
14.
An efficient implementation of parallel eigenvalue computation for massively parallel processing 总被引:4,自引:0,他引:4
This paper describes an efficient implementation and evaluation of a parallel eigensolver for computing all eigenvalues of dense symmetric matrices. Our eigensolver uses a Householder tridiagonalization method, which has higher parallelism and performance than conventional methods when problem size is relatively small, e.g., the order of 10,000. This is very important for relevant practical applications, where many diagonalizations for such matrices are required so often. The routine was evaluated on the 1024 processors HITACHI SR2201, and giving speedup ratios of about 2–5 times as compared to the ScaLAPACK library on 1024 processors of the HITACHI SR2201. 相似文献
15.
16.
17.
§1.引言 对Boltzmann方程求解,采用连续截面、精确角分布的蒙特卡罗模拟(下简记为MC),可以获得理想的结果,然而MC方法计算耗时多是其相对其它方法的最大不足,并行计算和高加速比是克服这种不足的可行途径。 相似文献
18.
本文在给出一种非递推形式的逆动力学计算公式的基础上,针对机械臂惯性矩阵的计算提出了一种面向O(n)个处理器的并行算法,并以PUMA560机器人的前3个臂为例进行了计算效率分析。 相似文献
19.
WUDP91多层分布并行处理系统 总被引:5,自引:0,他引:5
WUDP91多层分布并行处理系统是一个以计算机局部网络为基础,在网络工作站下连接多个处理单元,具有可变拓扑结构,两层分布并行处理功能的系统。在其上开发的多层分布并行操作系统和程序设计语言,使系统具有较高的执行速度和良好的并行效率。 相似文献