首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 296 毫秒
1.
如何在实际应用中发挥大规模并行机(MassivelyParallelProcessor,简称MPP)的最佳性能,是当今国内外急待需要解决的课题之一。本文仅从应用者的角度出发,对可以改善MPP有效速度的若干方法进行了探讨,这时使用MPP系统以及基于RISC芯片工作站的广大用户将具有一定的参考价值。  相似文献   

2.
周庭松 《计算机工程》1998,24(11):44-46
论述了MPP系统中节点机的通信结构,以及在主控机与节点机之间实现的Message Passing通信及其通信协议。  相似文献   

3.
实践表明,大规模并行处理系统(massivelyparalelprocesingsystem,MPP)的实际有效速度与其理论峰值速度往往存在着较大差距,有时仅能达到峰值速度的25%左右.鉴于目前许多领域的高性能科学计算都要把MPP系统作为主要的实现工具,因此上述问题已引起国内外专家的普遍关注.文中讨论了影响大规模并行处理系统有效速度主要因素之一的Cache缺失问题,并以ExemplarSPP1200/XA为例,在层次算法和可定域性两个方面实验并总结了提高系统应用性能的若干程序设计方法.  相似文献   

4.
求解三对角线性方程组的双向并行分裂法   总被引:3,自引:0,他引:3  
首先回顾了H.H.Wang的分裂法^[8]Michielse&Vorst给出的改进算法^[9],分析了影响分裂法及改进算法的并行效率的主要因素,然后提出了一种求解三对角方程组的双向并行分裂法(简记为DPP算法),DPP算法的通讯建立的次数为M&V算法的50%,数据传输量为其30%,最后在工作站网络环境下实现了DPP算法,并就并行效率与M&V算法进行了比较,结果表明在由6台工作站组成的网络中DPP算  相似文献   

5.
VPP500向量并行处理机是一台高度并行的分布式存储器巨型计算机,性能范围是6.4 ̄355GFLOPS,主存容量为1 ̄222GB。该系统可支持4 ̄222个由高带宽交叉开关网络互连的处理器。VPP500与当前大规模并行系统截然不同的三个关键特征决定了其体系结构。第一,它的组成部件是1.6GFLOPS的向量处理器,比大规模并行处理机(MPP)中使用的处理器快一个数量级。这种极高的单处理器性能降低了系统  相似文献   

6.
《计算机》2002,(3)
近100名电脑使用者元月14日聚集在上海,与AMD公司一同体验2002年最酷炫的AMD速龙XP处理器的超强性能。 会中,AMD公司中国区产品市场经理纪朝辉先生对这款产品的功能与应用做了精彩演说。随着Window XP上市之后,计算机使用者对处理器的功能需求更高,AMD速龙XP中的XP是指该处理器的eXtreme Performance(卓越性能),能为Microsoft Windows XP操作系统带来卓越的性能表现。 纪朝辉表示,AMD速龙XP处理器的性能在众多的实际应用中比同频率的产品高出了2…  相似文献   

7.
多级互连网络中的multicast通信   总被引:3,自引:1,他引:3  
MPP系统中的并行通信是目前并行处理研究的热点,改善并行通信性能,提高网络吞吐率是促进MPP性能发挥的关键问题。multicast通信是区别于点到点通信的一对多通信方式,因而功能更强大,使用起来更灵活方便,在并行处理中应用十分广泛。文中以基于开关元件实现结点间动态互连的多级互连网络为背景,研究了multicast通信路上算法的效率。  相似文献   

8.
《网络与信息》1998,12(9):49
unMicrosystems公司在7月份推出的新产品SPARCengineUltraAxmp,是一个板级解决方案,它能使原始设备制造商(OEM)在SPARC处理器和Solaris操作系统相结合的基础上开发高性能四路多处理嵌入式系统。采用该方案开发的应...  相似文献   

9.
Intergraph公司推出新型三维PC机Intergraph公司于1997年3月31日正式宣布,推出新型的三维PC机,它基于Windows/Win-dowsNT,并配有Intel的最新Pentium处理器。该处理器带有MMXTM多媒体增强技术。In...  相似文献   

10.
Base-nm-Cube是一种新型的MPP互连网络,具有平均距离短,易实现等优点。  相似文献   

11.
T63全球海气耦合预报模式的并行计算   总被引:1,自引:0,他引:1  
介绍了基于T63全球海气耦合业务预报模式的特点及基本原理,在分析了它的基本流程及串行运行时间的基础上,针对其巨大的计算量以及数据流特点,提出了基于纬圈并行的并行方案,并对I/O作了比较有效的优化,在神威并行机上实现后,在8处理器时取得了较好的效果,最大可扩展至48处理器。  相似文献   

12.
一种实用的并行计算模型   总被引:11,自引:0,他引:11  
对于当前流行的工作站集群环境和各类并行机系统,文中提出了一种实用的并行计算模型,即基于LogGP的非独占异质同步模型NHBL(Nondedicated Heterogeneous Barrier LogGP),它旨在反映具有异质性和非独占性的NOW计算环境对并行算法设计和分析的影响,然后用NHBL模型分析了PSRS算法在国家高性能计算中心(合肥)的工作站集群NHPCC-Cluster和曙光-1000MPP由的代价,并用实测结果进行了验证。  相似文献   

13.
邓波  杨晓东 《计算机科学》2000,27(12):20-23
1 引言大规模并行计算机(MPP)系统性能的发挥极大程度上依赖于互连网络的通信性能,互连网络采用的路由算法决定了消息在网络中如何选取路径,其性能对网络效率的发挥起着重要作用,根据允许选择路径的不同,路由算法有最短路径和非最短路径以及确定性和自适应性之分,自适应又有部分自适应和完全  相似文献   

14.
刘燕  徐炜遐  杨晓东 《计算机学报》1998,21(11):995-1002
传统大规模并行处理机系统中的互连网络及路由器在强同步方式下工作,相邻部由器间消息的传送必须保证一个周有完成,系统互连长度成为影响网络主频的重要因素,同时也限制了系统的可扩展性,采用流水通道可在一条通道上同时传送多个数据,使得网络的主频独立于线的长度,提高了网络的传输速率,本文介绍了一这思想,并对流水通道互连网络的实现技术进行了研究,着重阐述了源同步传输,切换技术,流控策略等几个关键技术问题。  相似文献   

15.
近年来,遥感图像几何校正的并行处理成为重点研究的对象·但现有的并行算法尚存在一些问题,这些算法不具备负载平衡能力或者全局计算量大,而且局部操作非常耗时·针对以上不足提出了一种基于动态分界点计算的并行几何校正算法PI WA-DDC·通过LogP模型,推导出PI WA-DDC算法具有良好的可扩展性·通过在MPP上的测试数据,验证了该算法具有良好的负载平衡能力和高效处理几何畸变的能力·  相似文献   

16.
This paper demonstrates the use of a model-based evaluation approach for instrumentation systems (ISs). The overall objective of this study is to provide early feedback to tool developers regarding IS overhead and performance; such feedback helps developers make appropriate design decisions about alternative system configurations and task scheduling policies. We consider three types of system architectures: network of workstations (NOW), symmetric multiprocessors (SMP), and massively parallel processing (MPP) systems. We develop a Resource OCCupancy (ROCC) model for an on-line IS for an existing tool and parameterize it for an IBM SP-2 platform. This model is simulated to answer several “what if” questions regarding two policies to schedule instrumentation data forwarding: collect-and-forward (CF) and batch-and-forward (BF). In addition, this study investigates two alternatives for forwarding the instrumentation data: direct and binary tree forwarding for an MPP system. Simulation results indicate that the BF policy can significantly reduce the overhead and that the tree forwarding configuration exhibits desirable scalability characteristics for MPP systems. Initial measurement-based testing results indicate more than 60 percent reduction in the direct IS overhead when the BF policy was added to Paradyn parallel performance measurement tool  相似文献   

17.
LSMPP并行C语言设计   总被引:1,自引:0,他引:1  
LSMPP并行C语言是针对LSMPP嵌入式并行计算机而设计的并行语言,在选取特定的C语言子集的基础上进行并行扩充得到,并增加了图像处理函数库及算术运算函数库,形成的面向图像处理的并行语言。  相似文献   

18.
It has been suggested that parallel processing helps in the solution of difficult discrete optimization problems, in particular, those problems that exhibit combinatorial search and require large-scale computations. By using a number of processors that are connected, coordinated and operating simultaneously, the solutions to such problems can be obtained much more quickly. The purpose of this paper is to propose an efficient parallel hypercube algorithm for the discrete resource allocation problem (DRAP). A sequential divide-and-conquer algorithm is first proposed. The algorithm is then modified for a parallel hypercube machine by exploiting its inherent parallelism. To allocate N units of discrete resources to n agents using a d-dimensional hypercube of p=2/sup d/ nodes, this parallel algorithm solves the DRAP in O((n/p+log/sub 2/p)N/sup 2/) time. A simulation study is conducted on a 32-node nCUBE/2 hypercube computer to present the experimental results. The speedup factor of the parallel hypercube algorithm is found to be more significant when the number of agents in the DRAP is much greater than the number of processing nodes on the hypercube. Some issues related to load balancing, routing, scalability, and mappings of the parallel hypercube algorithm are also discussed.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号