共查询到20条相似文献,搜索用时 125 毫秒
1.
雷瑞林 《电脑编程技巧与维护》2009,(2):5-5
计算机集群以其较高的性价比、很好的可扩展性被广泛应用于各种计算密集的任务中。在面向话题的文本检索研究中,由于所需处理的文本量巨大,使用IMB公司的BladeCenter JS21计算机集群,采用SPMD(Single ProgramMultiple Data)并行算法模式实现了数据的并行处理。本文主要介绍有关混合编程语言程序设计、编程技巧以及调试等方面的经验。 相似文献
2.
用于并行计算的PC集群系统构建* 总被引:2,自引:0,他引:2
在注射成形模拟研究过程中,涉及材料的牛顿和非牛顿黏性流动模拟和注射成形后期的冷却过程模拟,以及随时间变化各处的压力变化等科学和工程领域经常应用大规模科学计算。随着基于网格的计算和数据处理日益复杂,很多计算一般PC系统无法满足要求,需要超级计算环境。因为不断追求更高的计算精度和日益复杂的对象而扩大计算规模,传统的串行处理方式难以满足这些要求。因此,现代高性能计算的低成本、高效率成为选择并行计算的解决方式。重点阐述如何构建一个用于并行计算的PC集群系统,结合实例阐明MPI的实现方法,以及对PC集群系统进行了性 相似文献
3.
由高档微机或RISC工作站通过高速局域网连接呵成的集群系统的实现,使高性能计算机从研究与应用领域走进普通领域。该文介绍了如何在Linux操作系统下基于分布式存储结构构造一个由普通微机组成的Beowulf并行计算系统的方法。通过编制的并行计算算法对该Beowulf系统进行了并行效率的实际测试,测试结果表明该Beowulf系统具有很高的并行计算效率和并行加速比。 相似文献
4.
片级三维寄生电容的并行提取算法 总被引:1,自引:0,他引:1
随着多核CPU和分布式机群的日益普及,并行计算被日益广泛地应用于科学与工程实践中,以解决复杂的数值模拟问题.提出片级三维寄生电容的并行提取算法,它基于三维层次式块边界元素法,应用双向重叠组合思想将芯片划分为4类大小不同的"窗口";采用可变长的动态混合队列进行静态/动态结合的任务调度方法将全部"窗口"分配到不同进程,并在稀疏矩阵求和及进程间的规约求和运算中采用了提高并行效率的技术,达到了较好的负载平衡和较高的加速比.在分布式机群上采用消息传递接口编程的实验,验证了文中算法的有效性. 相似文献
5.
6.
在生物代谢网络研究中,为提供面向多用户的高性能计算服务,开发了基于Linux计算机集群的代谢网络模拟Web计算平台.该平台以集群为密集计算后台,以重建心肌细胞能量代谢网络为算例,采用集中式任务调度模型、加权结合轮询法的负载平衡技术以及消息传递接口并行编程模型,实现了对多用户并发任务的处理.通过实例应用和调度监控,验证了该平台在代谢网络模拟中的可用性,以及集群服务器并行处理多任务的有效性. 相似文献
7.
基于SMP集群系统的并行编程模式研究与分析 总被引:4,自引:1,他引:4
并行计算技术是计算机技术发展的重要方向之一,SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP,两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点进行了分析,介绍了在SMP集群系统中利用MPI和OpenMP混合编程的可行性方法。 相似文献
8.
针对Voronoi图k阶邻近矢量法构建复杂发生元困难,栅格法耗时长、精度受限等问题,提出了一种基于矩阵迭代的并行计算方法。以刀片机作为并行计算的硬件平台,采用Arcgis软件将MapInfo格式矢量数据转换为栅格数据,实现了MPI并行环境中Voronoi图k阶邻近的栅格计算新方法。实验结果表明,改进后的Voronoi图k阶邻近栅格并行算法明显地提高了计算效率,且在栅格Voronoi图精度较高时,运行时间的拐点后移,加速比提高。 相似文献
9.
10.
11.
12.
Athanasios I. Margaris 《International journal of parallel programming》2009,37(2):195-222
The objective of this paper is the review of the log file formats that allow the performance visualization of parallel applications
based on the usage of message passing interface (MPI) standard. These file formats have been designed by the LANS (Laboratory
for Advanced Numerical Software) group of the Argonne National Laboratory and they are distributed together with the corresponding
viewers as part of the MPE (multipurpose environment) library of the MPICH implementation of the MPI. The formats studied
in this paper is the ALOG, CLOG, SLOG1 and SLOG2 file formats—the formats are studied in chronological order and the main
features of their structures are presented. 相似文献
13.
14.
15.
面向大规模数据的快速并行聚类划分算法研究 总被引:1,自引:0,他引:1
随着聚类分析中处理数据量的急剧增加,面对大规模数据,传统K-Means聚类算法面临着巨大挑战。为了提高传统K-Means聚类算法的效率,针对已有基于MPI的并行K-Means聚类算法和基于Hadoop的分布式K-Means云聚类算法,从聚心初始化和通信模式等入手,提出了改进思路和具体实现。实验结果表明,所提算法能大大减少通信量和计算量,具有较高的执行效率。研究结果可以为以后设计更好的大规模数据快速并行聚类划分算法提供研究依据。 相似文献
16.
传统的Agent通信通常是采用基于远程过程调用方法和基于CORBA中间件方法,但这些方法的使用都存在很多限制条件,如仅限于客户/服务器模式,不适合Agent之间频繁对话的要求等,研究及实现了一种新的基于Agent的RTI通信机制,相对于传统方法,该机制具有更大的灵活性.同时采用并行策略处理基于Agent的通信连接,采用移动策略处理大数据量通信,并给出了相应的性能分析和实验结果. 相似文献
17.
将Parareal算法中的预估校正格式加以改进,提出时域分解并行算法。基于主从模式和消息传递,具体考察了群体通信和非阻塞通信模式,并设计出通用而简便的并行化模型。在集群系统下对热传导方程和对流扩散方程的数值模拟结果表明:算法具有较高的加速性能以及良好的可扩展性,体现了时域分解的独特优势。 相似文献
18.
19.
基于Message Passing的并行编程环境 总被引:3,自引:0,他引:3
在分布式并行计算机系统中,由于处理机间无共享内存,因此采用了MessagePassing方式实现处理间的通信。文中讨论了基于MessagePassing的并行编程环境所应具备的特点,然后介绍几种被人们普遍接受的并行编程环境。 相似文献
20.
As supercomputers scale to 1000 PFlop/s over the next decade, investigating the performance of parallel applications at scale on future architectures and the performance impact of different architecture choices for high-performance computing (HPC) hardware/software co-design is crucial. This paper summarizes recent efforts in designing and implementing a novel HPC hardware/software co-design toolkit. The presented Extreme-scale Simulator (xSim) permits running an HPC application in a controlled environment with millions of concurrent execution threads while observing its performance in a simulated extreme-scale HPC system using architectural models and virtual timing. This paper demonstrates the capabilities and usefulness of the xSim performance investigation toolkit, such as its scalability to 227 simulated Message Passing Interface (MPI) ranks on 960 real processor cores, the capability to evaluate the performance of different MPI collective communication algorithms, and the ability to evaluate the performance of a basic Monte Carlo application with different architectural parameters. 相似文献