期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

雷瑞林《电脑编程技巧与维护》2009,(2):5-5

计算机集群以其较高的性价比、很好的可扩展性被广泛应用于各种计算密集的任务中。在面向话题的文本检索研究中,由于所需处理的文本量巨大,使用IMB公司的BladeCenter JS21计算机集群,采用SPMD（Single ProgramMultiple Data）并行算法模式实现了数据的并行处理。本文主要介绍有关混合编程语言程序设计、编程技巧以及调试等方面的经验。相似文献

2.

用于并行计算的PC集群系统构建* 总被引：2，自引：0，他引：2

李敏张宜生李德群《计算机应用研究》2009,26(3):1042-1043

在注射成形模拟研究过程中,涉及材料的牛顿和非牛顿黏性流动模拟和注射成形后期的冷却过程模拟,以及随时间变化各处的压力变化等科学和工程领域经常应用大规模科学计算。随着基于网格的计算和数据处理日益复杂,很多计算一般PC系统无法满足要求,需要超级计算环境。因为不断追求更高的计算精度和日益复杂的对象而扩大计算规模,传统的串行处理方式难以满足这些要求。因此,现代高性能计算的低成本、高效率成为选择并行计算的解决方式。重点阐述如何构建一个用于并行计算的PC集群系统,结合实例阐明MPI的实现方法,以及对PC集群系统进行了性相似文献

3.

Beowulf并行计算系统的研究与实现

祝永志王国仁《计算机工程》2006,32(11):242-244

由高档微机或RISC工作站通过高速局域网连接呵成的集群系统的实现，使高性能计算机从研究与应用领域走进普通领域。该文介绍了如何在Linux操作系统下基于分布式存储结构构造一个由普通微机组成的Beowulf并行计算系统的方法。通过编制的并行计算算法对该Beowulf系统进行了并行效率的实际测试，测试结果表明该Beowulf系统具有很高的并行计算效率和并行加速比。相似文献

4.

片级三维寄生电容的并行提取算法 总被引：1，自引：0，他引：1

郑蓝舟喻文健尹航王泽毅《计算机辅助设计与图形学学报》2008,20(11)

随着多核CPU和分布式机群的日益普及,并行计算被日益广泛地应用于科学与工程实践中,以解决复杂的数值模拟问题.提出片级三维寄生电容的并行提取算法,它基于三维层次式块边界元素法,应用双向重叠组合思想将芯片划分为4类大小不同的"窗口";采用可变长的动态混合队列进行静态/动态结合的任务调度方法将全部"窗口"分配到不同进程,并在稀疏矩阵求和及进程间的规约求和运算中采用了提高并行效率的技术,达到了较好的负载平衡和较高的加速比.在分布式机群上采用消息传递接口编程的实验,验证了文中算法的有效性. 相似文献

5.

基于MPI的层状地层并行可视化技术

下载免费PDF全文

陈鹏任波郭振岗王乘《计算机工程》2008,34(9):281-282

为了提高层状地层的可视化绘制速度,结合地质探勘数据的特点,基于MPI开发地层的并行可视化程序,并采用Kriging方法对多个地层的数据进行并行插值计算。利用多台PC机搭建Windows2000 操作系统下的并行计算环境,计算时间统计数据对比表明并行计算方法能有效地节省计算时间。相似文献

6.

基于集群的代谢网络计算平台研究

贾璐罗若愚刘谦李亦学骆清铭《计算机应用与软件》2008,25(2):45-46,51

在生物代谢网络研究中,为提供面向多用户的高性能计算服务,开发了基于Linux计算机集群的代谢网络模拟Web计算平台.该平台以集群为密集计算后台,以重建心肌细胞能量代谢网络为算例,采用集中式任务调度模型、加权结合轮询法的负载平衡技术以及消息传递接口并行编程模型,实现了对多用户并发任务的处理.通过实例应用和调度监控,验证了该平台在代谢网络模拟中的可用性,以及集群服务器并行处理多任务的有效性. 相似文献

7.

基于SMP集群系统的并行编程模式研究与分析 总被引：4，自引：1，他引：4

宋伟宋玉《计算机技术与发展》2007,17(2):164-168

并行计算技术是计算机技术发展的重要方向之一，SMP与集群是当前主流的并行体系结构。当前并行程序设计方法主要采用基于消息传递模型的MPI和基于共享存储模型的OpenMP，两种编程模式各有特点和适用范围。对SMP集群以及MPI和OpenMP的特点进行了分析，介绍了在SMP集群系统中利用MPI和OpenMP混合编程的可行性方法。相似文献

8.

Voronoi图k阶邻近并行矩阵迭代算法

余婧曹菡靳朋飞《计算机工程与应用》2014,(6):102-105,131

针对Voronoi图k阶邻近矢量法构建复杂发生元困难,栅格法耗时长、精度受限等问题,提出了一种基于矩阵迭代的并行计算方法。以刀片机作为并行计算的硬件平台,采用Arcgis软件将MapInfo格式矢量数据转换为栅格数据,实现了MPI并行环境中Voronoi图k阶邻近的栅格计算新方法。实验结果表明,改进后的Voronoi图k阶邻近栅格并行算法明显地提高了计算效率,且在栅格Voronoi图精度较高时,运行时间的拐点后移,加速比提高。相似文献

9.

基于BEOWULF的PC集群系统设计及并行编程的研究

李翀罗家融王华忠《微计算机信息》2005,(24):64-67

介绍了机群的概念,重点介绍了Beowulf集群.在此基础上,构建了Beowulf PC集群,并详细介绍其软硬件的配置.最后,通过对MPI的介绍,结合实例,对系统进行了性能评测.此系统已运用于实际工作中,取得了良好的效果. 相似文献

10.

基于BEOWULF的PC集群系统设计及并行编程的研究

李翀罗家融王华忠《微计算机信息》2005,(14)

介绍了机群的概念,重点介绍了Beowulf集群。在此基础上,构建了BeowulfPC集群,并详细介绍其软硬件的配置.最后,通过对MPI的介绍,结合实例,对系统进行了性能评测。此系统已运用于实际工作中,取得了良好的效果。相似文献

11.

一种基于MPI的并行体绘制算法 总被引：5，自引：0，他引：5

梁峰鲁强曾绍群《计算机工程》2005,31(13):171-173

介绍了基于MPI并行程序开发平台实现的一种三维重建并行处理算法。算法采用了Master-Slave并行计算模型，针对射线投射方法的特点，为减少运算时间，选择对图像空间进行任务划分的策略，并用任务池方法实现了动态负载平衡。通过对虚拟中国人女性一号(VCH-FI)的头部和脚部数据集的重建，表明该算法在任务规模和节点规模上具有较好的可扩展性。相似文献

12.

Log File Formats for Parallel Applications: A Review

Athanasios I. Margaris 《International journal of parallel programming》2009,37(2):195-222

The objective of this paper is the review of the log file formats that allow the performance visualization of parallel applications based on the usage of message passing interface (MPI) standard. These file formats have been designed by the LANS (Laboratory for Advanced Numerical Software) group of the Argonne National Laboratory and they are distributed together with the corresponding viewers as part of the MPE (multipurpose environment) library of the MPICH implementation of the MPI. The formats studied in this paper is the ALOG, CLOG, SLOG1 and SLOG2 file formats—the formats are studied in chronological order and the main features of their structures are presented. 相似文献

13.

大规模并行计算机系统并行性能模拟技术研究 总被引：2，自引：0，他引：2

徐传福车永刚王正华《计算机科学》2009,36(9):7-10

性能模拟技术是计算机系统性能评价的重要手段.介绍了面向大规模并行计算机系统以及消息传递应用程序的并行性能模拟技术,总结了相关的关键技术和国内外研究现状.对几个代表性的并行模拟器系统进行了详细介绍.结合并行计算机系统和应用的发展趋势,讨论了未来并行模拟器设计、实现面临的问题和可能的解决方案. 相似文献

14.

MPICH在Windows操作系统中的实现与应用

邓聪梁晓冰田立松毛钧杰《计算机仿真》2005,22(12):263-265

该文给出了对应于MPI标准的MPICH软件包在Windows操作系统中的配置和在MSVC＋＋中的实现方法，并对MPI与C／C＋＋绑定的基本编程进行了简要介绍。然后将其与一种电磁场数值算法——时域有限差分法相结合，以一维情况为例，讨论了网络并行时域有限差分法的实现方法。通过在由两台PC机构成的最简单的PC机群上的编程实现，验证了这种方法的可行性和高效性，实验结果表明通过MPICH软件包实现时域有限差分法的网络并行运算，可以使这种算法的加速比达到1．8。相似文献

15.

面向大规模数据的快速并行聚类划分算法研究 总被引：1，自引：0，他引：1

牛新征佘堑《计算机科学》2012,39(1):134-137,151

随着聚类分析中处理数据量的急剧增加,面对大规模数据,传统K-Means聚类算法面临着巨大挑战。为了提高传统K-Means聚类算法的效率,针对已有基于MPI的并行K-Means聚类算法和基于Hadoop的分布式K-Means云聚类算法,从聚心初始化和通信模式等入手,提出了改进思路和具体实现。实验结果表明,所提算法能大大减少通信量和计算量,具有较高的执行效率。研究结果可以为以后设计更好的大规模数据快速并行聚类划分算法提供研究依据。相似文献

16.

基于Agent的RTI通信机制的研究及实现

赵浩泉赵怀慈《计算机仿真》2008,25(6)

传统的Agent通信通常是采用基于远程过程调用方法和基于CORBA中间件方法,但这些方法的使用都存在很多限制条件,如仅限于客户/服务器模式,不适合Agent之间频繁对话的要求等,研究及实现了一种新的基于Agent的RTI通信机制,相对于传统方法,该机制具有更大的灵活性.同时采用并行策略处理基于Agent的通信连接,采用移动策略处理大数据量通信,并给出了相应的性能分析和实验结果. 相似文献

17.

基于消息传递的时域分解并行算法研究

李永刚欧阳洁《计算机工程与应用》2006,42(18):32-36

将Parareal算法中的预估校正格式加以改进,提出时域分解并行算法。基于主从模式和消息传递,具体考察了群体通信和非阻塞通信模式,并设计出通用而简便的并行化模型。在集群系统下对热传导方程和对流扩散方程的数值模拟结果表明:算法具有较高的加速性能以及良好的可扩展性,体现了时域分解的独特优势。相似文献

18.

PVM网络并行计算实现方案

陈实魏尊策孙济洲《计算机工程》2003,29(15):70-71,124

使用双网卡方案实现了基于PVM平台的网络并行计算环境，并在该环境下测试了并行整体光照算法。对实际的测试结果进行了分析，讨论了利用PVM进行网络并行计算的机制和优化方法。相似文献

19.

基于Message Passing的并行编程环境 总被引：3，自引：0，他引：3

刘欣然胡铭曾《计算机工程》1997,23(5):17-20

在分布式并行计算机系统中，由于处理机间无共享内存，因此采用了ＭｅｓｓａｇｅＰａｓｓｉｎｇ方式实现处理间的通信。文中讨论了基于ＭｅｓｓａｇｅＰａｓｓｉｎｇ的并行编程环境所应具备的特点，然后介绍几种被人们普遍接受的并行编程环境。相似文献

20.

Scaling to a million cores and beyond: Using light-weight simulation to understand the challenges ahead on the road to exascale

《Future Generation Computer Systems》2014

As supercomputers scale to 1000 PFlop/s over the next decade, investigating the performance of parallel applications at scale on future architectures and the performance impact of different architecture choices for high-performance computing (HPC) hardware/software co-design is crucial. This paper summarizes recent efforts in designing and implementing a novel HPC hardware/software co-design toolkit. The presented Extreme-scale Simulator (xSim) permits running an HPC application in a controlled environment with millions of concurrent execution threads while observing its performance in a simulated extreme-scale HPC system using architectural models and virtual timing. This paper demonstrates the capabilities and usefulness of the xSim performance investigation toolkit, such as its scalability to 2²⁷ simulated Message Passing Interface (MPI) ranks on 960 real processor cores, the capability to evaluate the performance of different MPI collective communication algorithms, and the ability to evaluate the performance of a basic Monte Carlo application with different architectural parameters. 相似文献