共查询到20条相似文献,搜索用时 171 毫秒
1.
MPI集群通信性能分析 总被引:1,自引:0,他引:1
MPICH是国内常用的集群计算消息传递系统。MPICH库函数提供的集群通信函数对并行程序的性能有很大的影响。根据集群通信的功能特性.初步地分析了MPICH集群通信的实现机制,并在Windows-10M NOWs和Linux-100M NOWs 中测试了MPICH库函数提供的常用的集群通信函数的执行效率。 相似文献
2.
并行程序设计环境MPICH的应用机理分析 总被引:5,自引:0,他引:5
阐述了在PC集群中运用消息传递接口MPICH(Message Passing Interface and Chameleon)进行并行程序设计的基本方法,并以计算圆周率π值的并行算法程序为例,介绍了MPICH中基本例程的功能和调用方法,并行程序设计的关键技术是如何处理好各个进程之间的通信问题,MPICH采用紧迫协议和约定协议来协调各个进程之间的通信,同时也提供了一些阻塞处理函数和非阻塞处理函数,它们能够使进程充分利用系统资源,大大增加用户编程的灵活性。 相似文献
3.
基于MPICH2的高性能计算集群系统研究 总被引:4,自引:0,他引:4
目前在高等学校和科研机构中对于高性能计算的需求很大,而商业的超级计算机性能虽高但价格昂贵,同时这些单位又都拥有大量普通的PC机和网络设备.为了利用现有硬件资源获取高性能计算能力,文中研究了在PC机和Linux环境下构建基于MPICH2的高性能计算集群系统的方法,搭建了一个拥有16个节点的系统并利用高性能Linpack基准测试方法进行了性能测试.测试结果表明,这种构建高性能计算集群系统的方法切实可行,是低成本获取高性能计算能力的良好途径. 相似文献
4.
目前在高等学校和科研机构中对于高性能计算的需求很大,而商业的超级计算机性能虽高但价格昂贵,同时这些单位又都拥有大量普通的PC机和网络设备。为了利用现有硬件资源获取高性能计算能力,文中研究了在PC机和Linux环境下构建基于MPICH2的高性能计算集群系统的方法,搭建了一个拥有16个节点的系统并利用高性能Linpack基准测试方法进行了性能测试。测试结果表明,这种构建高性能计算集群系统的方法切实可行,是低成本获取高性能计算能力的良好途径。 相似文献
5.
MPI是广泛应用于集群系统的并行程序开发环境,MPI的容错是集群系统可靠性的关键问题。该文讨论了MPI标准中的容错,结合协调设置检查点和同步卷回等机制设计了基于检查点的卷回恢复系统MPIChaRR、该系统应用于Linux集群机,MPICH应用程序运行中的节点故障恢复是对用户透明的。 相似文献
6.
PVFS(ParallelVirtualFileSystem)广泛应用于PC集群并行计算环境中,通过ROMIO形式的MPI-IO接口与MPICH结合,用于提高数据文件的访问性能,通过对PVFS的源代码分析,得出PVFS的系统架构、运行机制与采用的策略,并在这个基础上找出元数据服务器并行化的可行性,以设计出并行元数据服务方案来提高元数据访问的吞吐率。 相似文献
7.
8.
虚拟实验室是依赖于计算机网络环境下的实验环境,其设计与应用有助于教学创新.虚拟实验室的实现,最需要解决的是实现大量数据的高速计算,对计算机性能有很高的要求.集群系统有良好的性能可扩展性,随着CPU个数的增加,其性能几乎是线性变化的.MPI并行环境是一个廉价、开放、高效的并行计算系统,在Linux集群中利用MPI并行环境可以很好地实现虚拟实验室所需要的高效数据处理.本文主要介绍MPICH的构建方法,提供软件的配置过程,并进行性能测试,本系统可用于图形计算、数值计算等. 相似文献
9.
10.
集群式计算机由于其良好的性能价格比已经成为高性能计算的主要发展方向,可靠性是这一类平台的主要问题.基于消息传递的MPI是广泛应用于集群系统的并行程序开发环境,实现MPI的容错对避免异常情况下应用程序从头执行造成的计算浪费具有重大意义.文中讨论了MPI标准中的容错以及回卷恢复这一容错技术,并以自强2000-SUHPCS为平台设计了针对MPICH并行消息传递库的容错系统. 相似文献
11.
12.
在以MPICH技术构建的局域网集群系统下,利用分子动力学并行计算软件Protomol和三维分子模拟软件VMD构建大规模并行计算平台,完成若干复杂分子动力学典型实例的仿真运算。计算结果表明:采用并行计算能持续有效地利用现有计算机资源,同时大幅度提高计算效率,在现有并行集群系统下可以获得3倍以上的加速比,为实现复杂分子动力学的深入研究提供了可行方案。 相似文献
13.
14.
Triggered by the ever increasing advancements in processor and networking technology, a cluster of PCs connected by a high-speed network has become a viable and cost-effective platform for the execution of computation intensive parallel multithreaded applications. However, there are two research issues to be tackled in the scheduling problem for PC cluster computing: (1) how to reduce the communication overhead of executing a multithreaded application on the cluster; (2) how to exploit the heterogeneity, which is unavoidable in an evolving PC cluster, for the application. In this paper, we propose to use a duplication based approach in scheduling tasks/threads to a heterogeneous cluster of PCs. In duplication based scheduling, critical tasks are redundantly scheduled to more than one machine, in order to reduce the number of inter-task communication operations. The start times of the succeeding tasks are also reduced. The task duplication process is guided given the system heterogeneity in that the critical tasks are scheduled or replicated in faster machines. The algorithm has been implemented in our experimental application parallelization system for generating multithreaded parallel code executable on a cluster of Pentium PCs. Our experiments, using three numerical applications and one protocol processing kernel (multithreading per request), have indicated that heterogeneity of PC cluster is indeed useful for optimizing the execution of parallel multithreaded programs. 相似文献
15.
本文针对前推回代法的潮流计算的潜在并行特点,对前推回代的在数据结构表达方式进行研究,比较了各种数据结构形式并行性计算速度的影响,并进行了仿真计算.利用C 语言和FORTRAN语言对比编写,并利用TCP/IP通讯协议、C/S力式,进行模拟试验.对其中遇到的若干问题进行分析讨论.利用IEEE69节点系统在在四台PC机上进行并行仿真计算,仿真结果表明并行计算提高了潮流计算效率起到了一定作用. 相似文献
16.
Previously, large-scale fluid dynamics problem required supercomputers, such as the Cray, and took a long time to obtain a solution. Clustering technology has changed the world of the supercomputer and fluid dynamics. Affordable cluster computers have replaced the huge and expansive supercomputers in computational fluid dynamics (CFD) field in recent years. Even supercomputers are designed in the form of clusters based on high-performance servers. This paper describes the configuration of the affordable PC hardware cluster as well as the parallel computing performance using commercial CFD code in the developed cluster. A multi-core cluster using the Linux operating system was developed with affordable PC hardware and low-cost high-speed gigabit network switches instead of Myrinet or Infiniband. The PC cluster consisted of 52 cores and easily expandable up to 96 cores in the current configuration. For operating software, the Rock cluster package was installed in the master node to minimize the need for maintenance. This cluster was designed to solve large fluid dynamics and heat transfer problems in parallel. Using a commercial CFD package, the performance of the cluster was evaluated by changing the number of CPU cores involved in the computation. A forced convection problem around a linear cascade was solved using the CFX program, and the heat transfer coefficient along the surface of the turbine cascade was simulated. The mesh of the model CFD problem has 1.5 million nodes, and the steady computation was performed for 2,000 time-integrations. The computation results were compared with previously published heat transfer experimental results to check the reliability of the computation. A comparison of the simulation and experimental results showed good agreement. The performance of the designed PC cluster increased with increasing number of cores up to 16 cores The computation (elapsed) 16-core was approximately three times faster than that with a 4-core. 相似文献
17.
为了加快在大规模神经网络训练下并行技术的训练速度问题,从BP算法的内部结构分析了BP神经网络算法的大规模行划分方法,提出了一种动态负载平衡方案。通过在PC集群环境下对并行算法的试验结果表明,这种并行划分提高了加速比,具有现实意义。 相似文献
18.
本文设计并实现了一个基于安腾2处理器的机群计算系统,并结合安腾2处理器和机群系统的特性,对气象应用并行程序进行了I/O问题优化、通信优化、计算代价优化和通信数据的Cache利用率优化,以发挥该机群系统的长处,规避其弱点。测试结果表明,该机群系统适合气象应用并行软件的高效并行计算。 相似文献
19.
20.
个人计算机性能的提高与Linux操作系统的发展使基于PC的Linux集群系统成为量子化学高性能计算的平台。本文研究了Gaussian 98程序在PentiumⅢ与Pentium 4计算机建立的两组小型集群系统中的运算性能。通过设计的5个计算样例,对Hartree-Fork、DFT、MP2级别的单点能量计算、几何结构优化、频率和NMR等化学性质计算在16个并行节点内的速度增长性与扩展性进行了分析和讨论,指出了主节点计算能力对整个集群系统效益的影响,结果表明各类计算作业在8-12节点内有着较好加速性,频率与MP2作业超过12节点后并行效益迅速下降,NMR计算在16节点时仍有较高速度增长性。 相似文献