介绍了WRF中尺度数值气象预报模式与联想深腾6800高性能计算机系统;概述WRF模式在联想深腾6800上的移植与测试过程.采用3D数据集em_quarter_ss进行性能分析与正确性测试,并绘制气象图.分析串、并行状态的运算加速比与处理器个数间的关系,发现并行效率相当好,非常适用于机群系统.WRF在深腾6800上的成功移植与测试,也为进一步将WRF应用于中国国家网格奠定了研究基础.  相似文献   

为了求解大规模的块三对角线性方程组,相关研究给出一种变形的并行Arnoldi算法,通过选取适当的基,使算法具有良好的并行性。结合已有的选基方式,在预处理思想的指导下,提出了另一种选基的方法。在联想深腾1800集群上进行的数值实验结果表明,该算法的收敛速度有了明显的提高,并保持了较高的并行性,并行效率可达到85%以上。  相似文献   

本文讨论了高级最优化工具箱(TAO)的一个解法器-非线性共轭梯度法的算法以及程序设计等问题,并对其分别在曙光2000和深腾6800进行了测试.通过对测试的结果分析比较,发现非线性共轭梯度算法在并行优化设计中具有很好的性质,并显示TAO1.5的实现具有很好的可移植性和可扩展性.  相似文献   

联想深腾1800获殊荣 在日前结束的北京市科学技术奖励大会暨2004年北京科技工作会议上,联想深腾1800荣获北京市科学技术一等奖。据了解,联想深腾1800是中国第一个实际速度超过每秒万亿次的高性能计算机产品,其整机Linpack实际性能达到了每秒钟1.046万亿次双精度浮点运算。(新)  相似文献   

MM5在深腾6800上的移植及其数值计算方法研究   总被引:1,自引:0,他引:1  
MM5是当今世界各国中短期天气及气候预测、实时预报和环境检测中使用十分广泛的数值模式,因此,如何提高软件的计算精度和计算效率是一个十分重要的问题.本文简要介绍了MM5的数值计算方法,为以后的研究提供帮助,并把MM5软件移植到深腾6800上进行并行计算.发现每当处理器增加一倍,其加速比为原来的1.5倍,可见其并行效率是较好的,值得在气象科研和业务中广泛使用.  相似文献   

由64个节点联想深腾7000高性能服务器组成的连理工大学校园网格计算平台中心节点顺利建成,实现了与原有联想深腾1800等产品组成的多计算平台的有效整合。本次联想为该校设计的高性能计算机总体方案,采用了先进的MPFS一体化并行文件系统,使校园网格计算平台计算能力理论峰值达到4.6Tflops,基于以太网并行效率70%以上,存储能力达到10TB。  相似文献   

本文根据影响并行蚁群算法性能的关键因素,提出了一种自适应的并行蚁群算法.首先提出了基于适应度和基于距离选择的两种不同的信息交流策略,使得各处理机自适应地选择与之进行信息交换的处理机,然后采用自适应的更新策略进行信息素的更新.为了增强该算法的搜索能力,还根据解的多样性给出了自适应地调节处理机之间的信息交流周期的方法.在MPP处理机深腾1800上对TSP问题的实验结果表明了该算法在保证有效的加速比的同时,具有很好的收敛性.  相似文献   

对称矩阵三对角化的有效并行块算法设计   总被引:1,自引:0,他引:1  
在矩阵数值计算中,块算法通常比非块算法更有效,但这也增加了并行算法设计和实现的难度.在广义稠密对称矩阵特征问题并行求解器中,并行块算法的构造可应用到正定对称矩阵的Choleski分解、对称矩阵的三对角化和回代转化(back-transiation)操作中.本文将并行块算法的讨论集中在具有代表性的对称矩阵三对角化上,给出在非块存储方式下对称矩阵三对角化的并行块算法设计方法.分析块算法大小同矩阵规模和处理器数量的关系.在深腾6800上的试验表明,我们的算法具有很好的性能,并得到了比ScaLAPACK更高的性能.  相似文献   

由64个节点联想深腾7000高性能服务器组成的连理工大学校园网格计算平台中心节点顺利建成,实现了与原有联想深腾1800等产品组成的多计算平台的有效整合。本次联想为该校设计的高性能计算机总体方案,采用了先进的MPFS一体化并行文件  相似文献   

Networks of workstations (NOWs) are becoming increasingly popular as a cost-effective alternative to parallel computers. These networks allow the customer to connect processors using irregular topologies, providing the wiring flexibility, scalability and incremental expansion capability required in this environment. Some of these networks use source routing and wormhole switching. In particular, we are interested in Myrinet networks because they are a well-known commercial product and their behavior can be controlled by the software running on the network interfaces (the Myrinet Control Program, MCP). Usually, the Myrinet network uses up*/down* routing for computing the paths for every source-destination pair. In this paper, we propose an in-transit buffer (ITB) mechanism to improve the network performance. We apply the ITB mechanism to NOWs with up*/down* source routing, like the Myrinet, analyzing its behavior on networks with both regular and irregular topologies. The proposed scheme can be implemented on Myrinet networks by simply modifying the MCP, without changing the network hardware. We evaluate by simulation several networks with different traffic patterns using timing parameters taken from the Myrinet network. The results show that the current routing schemes used in Myrinet networks can be strongly improved by applying the ITB mechanism. In general, our proposed scheme is able to double the network throughput on medium and large NOWs. Finally, we present a first implementation of the ITB mechanism on a Myrinet network  相似文献   

In this paper we present a parallel algorithm for solving the inverse Toeplitz Eigenvalue Problem. The algorithm has been implemented by using a cluster of personal computers, interconnected by a high‐performance Myrinet network. We have utilized standard public domain parallel environments for implementing the calculation part as well as the communications, thus producing portable software. The results obtained allow us to confirm the scalability and efficiency of the algorithm. Moreover, we have checked that by using the theoretical cost model provided by the ScaLAPACK we can predict the behaviour of the experimental results. Copyright © 2000 John Wiley & Sons, Ltd.  相似文献   

1 引文 Myrinet和Gigabit-Ethernet是当今世界上性能最好的两种可以运用于局域网的高性能并行计算的网络系统。它们以其高效、高速的传输特点在广泛的领域里得到了好评。但是,这两种同样是高端的网络产品,其实现的技术在很多方面却是大相径庭的。而在当今的网络协议中,TCP/IP协议是当然的主角。无论是万维网(WWW),还是一般的局域网(LAN),我们都曾经,或者正在使用TCP/IP协议。对于TCP/IP协议,Myrinet和Gigabit-Ethernet有着不同选择。虽然对于Myrinet来说,用户能够直接挂接TCP/IP  相似文献   

Myrinet: a gigabit-per-second local area network   总被引:2,自引:0,他引:2  
The Myrinet local area network employs the same technology used for packet communication and switching within massively parallel processors. In realizing this distributed MPP network, we developed specialized communication channels, cut-through switches, host interfaces, and software. To our knowledge, Myrinet demonstrates the highest performance per unit cost of any current LAN  相似文献   

VIA定义了一种低延迟、高带宽的数据传输模型,成为集群系统通讯技术的工业标准。本文介绍VIA的产生背景和结构特征,详细阐述了清华大学在Myrinet LANai9硬件上实现 的VIA原型-MyVIA2,最后给出了几种用户层通信软件的测试结果和比较分析。  相似文献   

并行集群系统的Linpack性能测试分析   总被引:2,自引:0,他引:2  
§1.引言 近些年随着计算机软硬件技术的提高,尤其是网络部件性能的提高,集群技术得到不断的发展。传统的PVP(Parallel Vector Processor)超级计算机以及MPP(Massively Parallel  相似文献   

在当前并行计算环境中的通信网络中,MPICH-1并行系统可以使用Internet和Myrinet千兆位包交换网络,而MPICH-2并行系统只能使用Internet,由于通信时间的限制而影响了整个系统性能.对MPICH-1和MPICH-2中的作业提交模式进行了研究,给出了一种在MPICH-2中使用Myrinet网络来提交作业的应用,从而达到减少了通信时间的目的.  相似文献   

FMP:一种适用于机群系统的快速消息传递机制   总被引:8,自引:1,他引:8  
目前,网络通信软件的处理开销已成为影响机群系统性能的瓶颈,为了提高机群系统的网络性能,本文设计了一种用于机群系统的快速消息传递机制FMP,并在Myrinet网络上加以实现。在Ultra2上的测试表明,FMP单字节数据包单向通信延迟为11.2μs,8K数据包网络带宽达到338Mb/s,较好地发挥了Myrinet网络硬件的性能,达到了减少通信开销,提高网络带宽的目的。  相似文献   

集群高性能通信系统综述   总被引:1,自引:0,他引:1  
本文分析对比了集群系统中几种主要的高性能通信系统: Myrinet, Infiniband和 Quadricso,在硬件方面对比了链路,交换设备与主机适配器,指出各自的组成与特点,在软件方面则描述了各自的软件实现:Myrinet/GM, Infiniband/VAPI 以及 Quadrics/Elanlib的主要特点和功能,最后给出各个系统的实际性能,结果表明:Infiniband系统性能高,结构简单,对应的体系结构具有良好的前景.  相似文献   

