期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

夏华夏郑纬民《软件学报》2001,12(1):26-32

并行虚拟机(parallelvirtualmachine,简称PVM)是并行工作站机群系统中流行的并行软件环境之一.分析了PVM的实现机制,指出PVM低效的原因,并给了基于高速精简通信层调整消息传递(fastmessagepassing,简称FMP)的高性能PVM(high-performancePVM,简称HPVM)的详细设计和实现. 相似文献

2.

MPI并行编程环境的研究 总被引：3，自引：0，他引：3

许丽华刘淼《现代计算机》2003,(4):28-31

以RISC工作站或高档微机通过LAN连接的机群系统已经成为并行计算的主流技术，研究适应机群系统的并行编程环境自然重要起来。在众多的并行编程环境中，应用较为广泛的有消息传递接口(MPI)标准和并行虚拟机(PVM)环境。本文重点分析了MPI编程环境，并出给了MPI并行程序设计的基本方法。相似文献

3.

C并行通信库及其实现技术

徐金秀《电子计算机》1997,(5):25-30

Ｃ语言并行通信库是Ｃ语言的重要组成部分，本文介绍了Ｃ并行通信库的功能、作用与特点，，并给出了基于ＳＩＭＤ虚拟机实现的内部通信模式及其技术。相似文献

4.

基于重排序变换和循环分布的通信优化算法

陈达智赵荣彩韩林丁锐赵捷《计算机科学》2012,39(9):296-301

针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优化算法。该算法根据给出的过程间副作用集合和基于mpi_wait/mpi_irecv移动的重排序变换规则,有序地采用重排序变换和循环分布,尽可能安全地扩大点到点非阻塞通信中通信与计算的重叠窗口,使MPI自动并行化编译器生成具有更多计算重叠通信的消息传递代码。实验结果表明,该算法能够隐藏更多的点到点非阻塞通信开销,并且明显提升消息传递程序的加速比。相似文献

5.

基于网络的分布并行虚拟计算机的实现 总被引：2，自引：0，他引：2

梅皓沈志宇《计算机工程与设计》2001,22(4):63-68

构造了一个基于网络的分布并行虚拟计算机DPVM,它由虚拟机层、通信层和基本类层组成,包括服务器,工作机和客户机3种不同类型的机器,在简要介绍DPVM的总体结构之后,从服务器,任务通信,程序输出和消息传递并行语义的面向对象实现几方面对系统实现的关键技术进行讨论。相似文献

6.

MPI技术在胶州湾水质预报系统的应用研究

杜巍牛沛黄伟建《计算机工程与设计》2013,34(6)

为了能够更高效的提高胶州湾水质预报系统的运行速度,在原有基于串行模式的预报系统中引入了消息传递接口MPI (message-passing interface)并行处理技术,并在该系统中分别采用组通信模式和非阻塞通信模式,把整个水质预报系统分解为多个子任务,在基于MPI消息传递模式的集群系统中分别进行运算,通过实验表明了两种通信模式在运算速度上的差异,在预报系统中非阻塞通信模式比组通信模式更加优化.因此,非阻塞通信模式对水质预报模式的改进具有很大的潜力. 相似文献

7.

KD60集群消息传递接口群集通信算法优化

郑启龙汪睿周寰《计算机应用》2011,31(6):1453-1457

大规模集群已经发展到多核的时代,多核架构对并行计算提出了新的要求。消息传递接口(MPI)是最常用的并行编程模型,而群集通信又是MPI中的重要组成部分。研究高效的群集通信算法对并行计算效率的提升有着重要的作用。KD60平台是采用首款国产多核芯片——龙芯3号搭建的国产万亿次多核集群。首先分析了KD60平台多核集群的体系特征以及多核架构下通信具有的层次性特征;然后分析原有群集通信算法实现原理及其不足;最后以广播为例,在原有算法基础上,采用一种基于片上多核(CMP)架构改进算法,改变原有算法通信模式,同时结合实验平台KD60体系特征,对算法做了体系相关优化。实验结果表明,改进算法能够很好地利用多核结构的特点,提高了群集通信广播算法的性能。相似文献

8.

SMB协议在异构网络并行FDTD计算中的应用研究

刘瑜袁宏春梁正《计算机应用》2008,28(2):279-282

在多系统异构局域网中,由于不同操作环境的消息传递接口（MPI）程序缺乏互操作性,使得并行时域有限差分运算(FDTD)难以充分利用局域网内的计算资源。对此,提出利用应用层服务消息块（SMB）协议实现异构FDTD计算,并通过内存文件存取、内存映射数组以及引入冗余计算等方法来缓解与克服SMB通信延迟对并行性能的影响。数值模拟实例验证了新方法的可行性与正确性,所得加速比、并行效率等性能指标参数与常规同构MPI消息传递方法基本相当。相似文献

9.

机群系统中基于MPI的多维稀疏数组传递方法

俞时权胡浩民马德云《计算机工程》2003,29(5):69-71

机群系统是一种分布存储系统，它主要利用消息传递方式来实现各结点之间的通信。而MPI（Message Passing Interface）作为一种基于消息传递的并行程序设计环境，已广泛应用于多种并行系统，尤其是像机群系统那样的分布存储并行机。该文主要探讨了MPI中的消息传递调用接口，提出了几种有效的在结点间传递多维稀疏数组的方法，并通过实践加以比较。相似文献

10.

基于NoC的多核分布式操作系统

下载免费PDF全文

胡新安付方发孙俊喻明艳《计算机工程》2012,38(5):259-261

采用主从控制方式和消息传递通信相结合的非均衡设计方法,设计基于片上网络(NoC)的多核分布式操作系统。在该系统中,主控节点通过资源池统计全局资源信息,利用运行时任务调度完成相关任务分派。从节点以异步统计模式反馈资源信息,并使用虚拟内存技术实现并行应用子进程的创建、加载和执行。测试结果表明,该系统能有效支持基于消息传递接口的并行程序的调度、加载及执行。相似文献

11.

MPI网络通信模型的数值应用 总被引：3，自引：0，他引：3

曹骥袁勇《计算机工程》2003,29(16):13-15

讨论并行支撑环境MPI的并行通信性能模型，测试了点对点和组通信下的若干性能指标，归纳出这些性能指标的统计模型，以作为工程问题并行计算可行性和可扩充性评价的基础。相似文献

12.

MPI中的3种数据打包发送方式及其性能分析 总被引：1，自引：0，他引：1

蒋英雷永梅《计算机工程》2002,28(8):261-263,278

首先介绍了在MPI并行编程环境下，实现群体发送的3种打包发送方式，然后分别分析了这3种发送方式的性能，最后总结出了这3种打包发送方式各自适用的环境。相似文献

13.

MPI程序的Petri网模型及其验证 总被引：1，自引：0，他引：1

眭聃王力生叶青《计算机应用与软件》2007,24(10):205-206,209

利用PVM程序中抽取Petri网的方法实现了MPI程序的部分功能语句的Petri网抽象,并分别针对MPI-1和MPI-2在通信方式上的新特性给出对应的Petri网模型抽象方法,使利用Pertri网模型对MPI程序正确性进行理论验证成为可能. 相似文献

14.

Distributed computing on cluster systems

《国际计算机数学杂志》2012,89(3):383-397

Message Passing Interface (MPI) allows a group of computers in a network to be specified as a cluster system. It provides the routines for task activation and communication. Writing programs for a cluster system is a difficult job. In this paper the Message-passing Interface is presented. Parallel programs using the WMPI, a version of MPI, to solve the pi(π) calculation the quick sort algorithm and the Torsion problem are presented. The programs are written and compiled in Microsoft Visual C+ +. 相似文献

15.

基于MPI的几种算法的并行编程通用算法 总被引：1，自引：0，他引：1

蒋英雷永梅《计算机工程与应用》2003,39(3):139-141,195

针对在MPI并行编程环境下编程比较困难的情况,该文首先介绍了二维及三维分块通信的通用并行算法。然后,开发了一个矩阵相乘的通用并行算法模块,并分析了其加速比与数组规模及结点数间的关系。最后,笔者通过一个具体实例———拉格朗日插值算法的并行为例,分析了对于多重for循环的并行的一种算法。在此基础上,建立了一个通用的基于MPI的一些算法的通用的并行编程函数库。相似文献

16.

基于Linux集群的并行环境简单架设* 总被引：9，自引：0，他引：9

黄旭东林鹭《计算机应用研究》2004,21(11):254-256

并行计算在各个领域的应用越来越广泛,而基于Linux集群的MPI并行环境是一个廉价、高效的并行计算系统。介绍了两种简单的基于Linux集群的MPI并行环境的构建方法,并且提供了软件的详细配置过程。相似文献

17.

High Performance RDMA-Based MPI Implementation over InfiniBand 总被引：5，自引：0，他引：5

Jiuxing Liu Jiesheng Wu Dhabaleswar K. Panda 《International journal of parallel programming》2004,32(3):167-198

Although InfiniBand Architecture is relatively new in the high performance computing area, it offers many features which help us to improve the performance of communication subsystems. One of these features is Remote Direct Memory Access (RDMA) operations. In this paper, we propose a new design of MPI over InfiniBand which brings the benefit of RDMA to not only large messages, but also small and control messages. We also achieve better scalability by exploiting application communication pattern and combining send/receive operations with RDMA operations. Our RDMA-based MPI implementation achieves a latency of 6.8 sec for small messages and a peak bandwidth of 871 million bytes/sec. Performance evaluation shows that for small messages, our RDMA-based design can reduce the latency by 24%, increase the bandwidth by over 104%, and reduce the host overhead by up to 22% compared with the original design. For large data transfers, we improve performance by reducing the time for transferring control messages. We have also shown that our new design is beneficial to MPI collective communication and NAS Parallel Benchmarks. 相似文献

18.

求解多段图问题的并行动态规划算法

崔焕庆王英龙《计算机应用与软件》2011,28(12)

多段图问题是一类特殊的单源最短路径问题。在串行动态规划算法的两种实现方法的基础上,根据图中顶点的编号,提出两种在集群环境下进行任务分割的并行化求解方法,并使用MPI进行实现。实验结果表明,所提出的算法具有较高的加速比和较低的通信复杂度、时间复杂度。算法不限于某种结构的集群,通用性强。相似文献

19.

多核处理器并行计算模型研究

李静梅张岐王军锋《电脑学习》2011,1(5)

针对并行计算机体系结构中没有通用的计算模型这一问题,分析了一些现有的典型计算模型,在同步性、通信方式、参数方面进行比较,以LogGP模型为基础提出一种改进的mzLogGP模型。利用MPI并行算法对满足节点计算资源非独占、网络存在拥塞条件下的并行程序进行分析与测试,通过增加memory层次化层数和网络拥塞指数这两个参数,计算其计算开销和通信开销,将实测时间与预测时间进行比较,可知随节点数的增加系统误差不断减小,说明该新模型能改善并行应用在多核处理器集群平台上运行的性能,具有较好的可扩展性。相似文献

20.

Performance Modeling and Evaluation of MPI

《Journal of Parallel and Distributed Computing》2001,61(2):202-223

Users of parallel machines need to have a good grasp for how different communication patterns and styles affect the performance of message-passing applications. LogGP is a simple performance model that reflects the most important parameters required to estimate the communication performance of parallel computers. The message passing interface (MPI) standard provides new opportunities for developing high performance parallel and distributed applications. In this paper, we use LogGP as a conceptual framework for evaluating the performance of MPI communications on three platforms: Cray-Research T3D, Convex Exemplar 1600SP, and a network of workstations (NOW). We develop a simple set of communication benchmarks to extract the LogGP parameters. Our objective in this is to compare the performance of MPI communication on several platforms and to identify a performance model suitable for MPI performance characterization. In particular, two problems are addressed: how LogGP quantifies MPI performance and what extra features are required for modeling MPI, and how MPI performance compare on the three computing platforms: Cray Research T3D, Convex Exemplar 1600SP, and workstations clusters. 相似文献