共查询到18条相似文献,搜索用时 62 毫秒
1.
SMP机群混合编程模型研究 总被引:12,自引:0,他引:12
研究了适用于 SMP机群的混合编程模型 ,并把它划分为 Open MP MPI和 Thread MPI两类 .通过研究指出 ,Open MP MPI优于 Thread MPI.在此基础上 ,重点研究了 Open MP MPI的实现机制、粗粒度和细粒度并行化方法、循环选择、优化措施以及注意事项等 ,得出细粒度并行化的 Open MP MPI是 SMP机群编程模型的一个较好选择的结论 相似文献
2.
3.
简要综述并行计算的思想,并对分布式内存结构和共享式内存结构两种结构的特点进行比较。叙述如何应用OpenMP和MPI进行混合编程,以及相应的混合编程模型。通过一个实例,针对多核CPU组成的SMP构架的集群,实现OpenMP和MPI混合编程的性能对比和结论分析。 相似文献
4.
用商品SMP的机群构造超级计算机已经越来越普遍,并且代表了超级计算机体系结构的发展方向。但如何让用户只使用单一消息传递编程模型就能高效利用全系统资源的问题还在困扰着开发商和用户。如何解决这个问题已经成为当务之急。本文较为详细地介绍了到目前为止,国外在探讨解决这个问题时所使用的各种技术,分析了它们的特点、解决问题的程度,以及应用前景,并对这些技术以后的探讨方向做了预测。 相似文献
5.
并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点进行了分析,介绍了在SMP集群系统中利用MPI和OpenMP混合编程的可行性方法。 相似文献
6.
并行算法的设计在气象天气预报模式的开发中是至关重要的,由于当前高性能计算领域多节点多处理器的分布/共享式并行计算机的发展,气象模式的最优并行算法设计成为研究重点。在IBM SP并行机上开发建立了新的并行有限区同化预报系统。介绍了并行模式的纯MPI方案及OpenMP/MPI混合编程方案的设计原则,分析了比较了两种方案的并行性能。 相似文献
7.
8.
9.
10.
基于SMP集群的三维网格多粒度混合并行编程模型 总被引:2,自引:0,他引:2
为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法.对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP混合并行算法,并在SMP集群上同粗粒度MPI(Message Passing Interface)并行算法做了性能比较.结果表明,采用该多粒度混合并行编程模型具有更好的加速比和运行效率. 相似文献
11.
基于SMP集群系统的并行编程模式研究与分析 总被引:4,自引:1,他引:4
并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点进行了分析,介绍了在SMP集群系统中利用MPI和OpenMP混合编程的可行性方法。 相似文献
12.
介绍了采用双核处理器的共享存储多处理机(SMP)作为计算节点时,高性能并行计算集群的结构。研究了此类系统的并行计算粒度和优化方法,描述了该集群MPI+OpenMP的混合编程平台构建方法。利用此平台,实现了求解现行方程组的Mann迭代算法,通过数值测试,表明此类集群具有良好的计算性能。此系统已用于实际工作中,取得了良好的效果。 相似文献
13.
14.
15.
在Linux操作系统和MPI并行环境下,由多台微机组成的机群上,实现了分布式决策支持系统中T.cover最优投资决策模型的并行化。在并行算法中采用组消息通讯和阻塞同步的方式实现了投资决策数据的并行计算。 相似文献
16.
This article focuses on the effect of both process topology and load balancing on various programming models for SMP clusters
and iterative algorithms. More specifically, we consider nested loop algorithms with constant flow dependencies, that can
be parallelized on SMP clusters with the aid of the tiling transformation. We investigate three parallel programming models,
namely a popular message passing monolithic parallel implementation, as well as two hybrid ones, that employ both message
passing and multi-threading. We conclude that the selection of an appropriate mapping topology for the mesh of processes has
a significant effect on the overall performance, and provide an algorithm for the specification of such an efficient topology
according to the iteration space and data dependencies of the algorithm. We also propose static load balancing techniques
for the computation distribution between threads, that diminish the disadvantage of the master thread assuming all inter-process
communication due to limitations often imposed by the message passing library. Both improvements are implemented as compile-time
optimizations and are further experimentally evaluated. An overall comparison of the above parallel programming styles on
SMP clusters based on micro-kernel experimental evaluation is further provided, as well. 相似文献
17.
18.
并行FFT是解决大数据量FFT运算耗时过久的重要途径,在PC机群上实现并行FFT是一种低成本、高效率的解决方案。本文讨论了PC机群环境下MPI并行FFT实现,并利用建立的平台,对并行算法进行了测试,得出了一些有意义的结论和方法。 相似文献