首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
一、Linux机群其特点与应用领域 所谓linux机群,是利用商品化的工业标准互联网络将各种普通linux服务器连接起来,通过特定的方法,向用户提供更高的系统计算性能、存储性能和I/O性能,并具备单一系统映象(SSI)特征的分布式存储MIMD并行计算机系统。与SMP、MPP及beowulf机群相比,机群在性能价格比、可靠性、可扩展性、可管理性、应用支持性方面有着更为明显的优势。由于机群在性能上的优势,  相似文献   

2.
本文提出一个机群组织、数据驱动LISP机的系统结构方案。系统有多个基本模块,经互连网连接,易于扩展,便于用VLSI技术实现。每个基本模块是一个处理机群,由接口处理器、调度处理器、存储管理处理器和多个表处理器组成。一台具有基本模块功能的LISP模型机已经实现。  相似文献   

3.
多处理器共享缓存设计与实现   总被引:1,自引:0,他引:1  
高速缓存作为中央处理器(CPU)与主存之间的小规模快速存储器,解决了两者数据处理速度的平衡和匹配问题,有助于提高系统整体性能.多处理器(SMP)支持共享和私有数据的缓存,Cache一致性协议用于维护由于多个处理器共享数据引发的多处理器数据一致性问题.论述了一个适用于64位多核处理器的共享缓存设计,包括如何实现多处理器缓存一致性及其全定制后端实现.  相似文献   

4.
基于SMP集群的多层次并行编程模型与并行优化技术*   总被引:4,自引:0,他引:4  
详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行优化技术,并指出单处理器性能优化是提高并行程序性能一个不容忽视的问题。  相似文献   

5.
PC机环境中的状态检测和空闲机选择   总被引:4,自引:0,他引:4  
l引言现有的机群管理软件主要用于工作站机群,不能在PC机群上运行。因此,针对我国国情,开发PC机群上的管理软件是十分有价值的。机群管理软件的前提是存在一个能正确反映系统当前负载情况的负载指标。机群系统的一个主要目标就是提高系统性能,即缩短作业的平均响应时间。  相似文献   

6.
SMP机群混合编程模型研究   总被引:12,自引:0,他引:12  
研究了适用于 SMP机群的混合编程模型 ,并把它划分为 Open MP MPI和 Thread MPI两类 .通过研究指出 ,Open MP MPI优于 Thread MPI.在此基础上 ,重点研究了 Open MP MPI的实现机制、粗粒度和细粒度并行化方法、循环选择、优化措施以及注意事项等 ,得出细粒度并行化的 Open MP MPI是 SMP机群编程模型的一个较好选择的结论  相似文献   

7.
有限元单元计算子程序的OpenMP并行化   总被引:3,自引:1,他引:2       下载免费PDF全文
Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行了并行化实现。在机群的一个双CPU的SMP节点上的测试表明,共享并行化使得该单元子程序的性能提高了一倍。  相似文献   

8.
应用背景:进入二十一世纪,机(集)群已成为高性能服务器的主流体系结构,它以商用服务器为结点,通过高速通信网络实现结点间互连,对外提供单一系统映像,以支持大规模的科学工程计算、信息服务和事务处理。 据专家介绍,机群(Cluster)服务器是当前高性能服务器家族中最受关注的一个分支,其性能覆盖小型机(SMP UNIX工作站/服务器)到大型机(超级服务器),具有很高的性能价格比,有些高端机群服务器已在石油地震资料处理、基因和蛋白质计算等重要领域得到了广泛应用。机群计算将成为格点计算(Grid computing)的一种主要实现形式,国际上甚至有些专家预言:格点计算环境将是新一代的Internet,而机群服务器则将是其中的关键设备。风高效,外观朴实典雅,嵌入式液晶显示屏可提供自然、简洁的管理操作界面,即使在结点机发生软硬件故障的情况下也能独立地正常工作,确保全部系统运行状况尽在系统管理员的掌控之中。  相似文献   

9.
Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行了并行化实现。在机群的一个双CPU的SMP节点上的测试表明,共享并行化使得该单元子程序的性能提高了一倍。  相似文献   

10.
1.引言可扩放性是指并行算法有效利用可扩充的处理机数目的能力,目前已经提出了许多可扩放性度量方法,其中最典型的是:等效率方法、等平均速度方法和平均延迟方法。等效率的方法严格地说只是一种分析的方法,在实际应用中不够准确,而且该方法给出的是工作量与处理器数的关系函数,反映了工作量随处理器数变化的趋势,并没有一个量化的数据。等平均速度的方法将平均速度作为衡量可扩放性的主要指标,是一种将算法与机器相结合的基于测量的方法,但是在实际情况中很难精确地测量出程序运行的速度。平均延迟的方法使用平均计算延迟作为衡量可扩放性的主要指标,精确地考虑了算法与体系结构两者的特性,也是一种基于测量的方法,但该方法需要使用专用的硬件或者专门的系统级软件来测量并行程序运行时每个处理器上的延迟时间,因此难以广泛地应用于各种并行机上。  相似文献   

11.
SMP机群系统因其良好的性价比、卓越的可扩展性与可用性,逐渐成为当前高性能计算机领域的主流结构.这种结点内共享存储、结点间消息传递的两级混合结构是目前并行计算研究的热点,在单个SMP结点中,总线和内存带宽是否满足CPU和I/O的需求对于访存密集型应用的性能影响很大。本文针对访存密集型应用的特点测试分析了在SMP机群中访存冲突对系统性能的影响,结果表明我们的SMP结点存在性能瓶颈,这种量化分析对于设计大规模的基于SMP的机群系统有很好的指导意义.  相似文献   

12.
SMP集群系统上矩阵特征问题并行求解器的有效算法   总被引:2,自引:0,他引:2  
对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步 .针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI OpenMP混合并行算法 .算法研究集中在SMP集群系统环境下的负载平衡、通信开销和性能评价 .混合并行算法的设计结合了粗粒度线程并行模式和任务共享的动态调用方法,改善了MPI算法中的负载平衡问题、降低了通信开销 .在深腾6800上的实验表明,基于混合并行算法的求解器比纯MPI版本的求解器具有更好的性能和可扩展性 .  相似文献   

13.
国产万亿次机群系统NPB性能测试分析   总被引:3,自引:2,他引:1  
对3个国产万亿次机群系统进行了NPB性能测试分析,重点研究大规模并行处理时(处理器数目达到上千个)的性能特点和趋势.分析了不同的处理器、互连网络等系统配置对NPB性能的影响,发现NPB的8个程序在3个万亿次机器上的性能特点和表现并不一致,表明国产高性能机群在设计上正在逐渐走出同质化的趋势,向多样化发展.进一步分析表明,目前NPB程序的可扩展性可以达到几百个处理器,但尚不能达到上千个处理器,NPB程序能发挥出的系统峰值的百分比仍然徘徊在10%左右,机群系统的并行可扩展性和应用程序对机器运算潜能的利用还需要进一步提高.对于处理器数目达到上千个的万亿次机群系统来说,对集合通信和细粒度通信能力的支持亟需提高.  相似文献   

14.
高性能计算集群用于高效并行计算,具有很高的性价比和良好的可扩展性,如何测试和评价集群系统性能成为一个关键问题。本文基于6个节点的集群进行Linpack测试,测试不同问题规模、计算节点数、求解矩阵数据分块NB、处理器网格拓扑P×Q、网络通信等重要因素,将单机与集群的计算性能进行对比,测试集群性能,结果表明:该集群的并行计算性能良好,可扩展性强,但硬件通讯能力需进一步改善。应用该集群到实际的地震大数据计算中,该集群的并行计算能力得到了很大的提升。  相似文献   

15.
SMP机群系统是一种新型的系统结构。由于依赖于处理器的传统加速比模型不再适用于SMP机群系统,文中提出了面向结点的加速比模型,它将传统的串行与并行的对比关系扩展为个体与整体之间的对比关系。通过对基于处理器的传统加速比概念的研究,推导出了基于SMP机群系统的面向结点加速比的计算公式。面向结点加速比模型充分考虑了实际运行时间的可测性,反映出了系统在使用了多个结点之后性能的改变。事实上,传统的加速比模型  相似文献   

16.
在OLTP应用中数据库集群是一种有效的并行处理方案,由于以前对数据库集群特别是异构情况下的性能评价不够完善,本文主要研究数据库异构集群的性能模型,分析了CPU和内存两种资源的异构带来性能影响,并给出了异构集群并行性的度量标准及系统有效性评估公式。最后,通过TPC-C实验表明数据库异构集群在OLTP处理中仍具有良好的可扩展性,次线性的加速比,以及高效费比的并行处理服务。  相似文献   

17.
The Earth Simulator (ES) is an SMP cluster system. There are two types of parallel programming models available on the ES. One is a flat programming model, in which a parallel program is implemented by MPI interfaces only, both within an SMP node and among nodes. The other is a hybrid programming model, in which a parallel program is written by using thread programming within an SMP node and MPI programming among nodes simultaneously. It is generally known that it is difficult to obtain the same high level of performance using the hybrid programming model as can be achieved with the flat programming model.

In this paper, we have evaluated scalability of the code for direct numerical simulation of the Navier–Stokes equations on the ES. The hybrid programming model achieves the sustained performance of 346.9 Gflop/s, while the flat programming model achieves 296.4 Gflop/s with 16 PNs of the ES for a DNS problem size of 2563. For small scale problems, however, the hybrid programming model is not as efficient because of microtasking overhead. It is shown that there is an advantage for the hybrid programming model on the ES for the larger size problems.  相似文献   


18.
基于半经典分子动力学模型,在SMP集群中实现激光化学反应双层并行模拟系统。结合粗粒度的原子分解算法和细粒度的矩阵并行乘法实现激光化学反应模拟中力计算部分的并行化,分析粒度划分对半经典分子动力学模拟并行效率的影响。在SMP集群中测试表明,采用128个处理器模拟由500个C原子构成的分子体系,并行效率可达70%。在CPU数量固定的情况下,SMP节点内的细粒度的并行对提高半经典分子动力学模拟并行效率影响较大。该系统能够模拟大分子体系的激光化学反应,在提高加速比的同时保证计算资源的利用效率,满足激光化学反应模拟需求。  相似文献   

19.
可扩展性是设计并行计算系统和并行算法所要考虑的一个重要性能指标。分析了等效率、等速度、平均延迟和等并行计算开销比几种并行系统可扩展性模型的特征,提出了一种新的更有效的可扩展性度量标准。通过实验结果分析,该模型能很好地评测并行计算系统的可扩展性。  相似文献   

20.
Scalability is an important performance metric of parallel computing, but the traditional scalability metrics only try to reflect the scalability for parallel computing from one side, which makes it difficult to fully measure its overall performance. This paper studies scalability metrics intensively and completely. From lots of performance parameters of parallel computing, a group of key ones is chosen and normalized. Further the area of Kiviat graph is used to characterize the overall performance of parallel computing. Thereby a novel scalability metric about iso-area of performance for parallel computing is proposed and the relationship between the new metric and the traditional ones is analyzed. Finally the novel metric is applied to address the scalability of the matrix multiplication Cannon’s algorithm under LogP model. The proposed metric is significant to improve parallel computing architecture and to tune parallel algorithm design.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号