共查询到18条相似文献,搜索用时 296 毫秒
1.
如何在实际应用中发挥大规模并行机(MassivelyParallelProcessor,简称MPP)的最佳性能,是当今国内外急待需要解决的课题之一。本文仅从应用者的角度出发,对可以改善MPP有效速度的若干方法进行了探讨,这时使用MPP系统以及基于RISC芯片工作站的广大用户将具有一定的参考价值。 相似文献
2.
论述了MPP系统中节点机的通信结构,以及在主控机与节点机之间实现的Message Passing通信及其通信协议。 相似文献
3.
实践表明,大规模并行处理系统(massivelyparalelprocesingsystem,MPP)的实际有效速度与其理论峰值速度往往存在着较大差距,有时仅能达到峰值速度的25%左右.鉴于目前许多领域的高性能科学计算都要把MPP系统作为主要的实现工具,因此上述问题已引起国内外专家的普遍关注.文中讨论了影响大规模并行处理系统有效速度主要因素之一的Cache缺失问题,并以ExemplarSPP1200/XA为例,在层次算法和可定域性两个方面实验并总结了提高系统应用性能的若干程序设计方法. 相似文献
4.
求解三对角线性方程组的双向并行分裂法 总被引:3,自引:0,他引:3
首先回顾了H.H.Wang的分裂法^[8]Michielse&Vorst给出的改进算法^[9],分析了影响分裂法及改进算法的并行效率的主要因素,然后提出了一种求解三对角方程组的双向并行分裂法(简记为DPP算法),DPP算法的通讯建立的次数为M&V算法的50%,数据传输量为其30%,最后在工作站网络环境下实现了DPP算法,并就并行效率与M&V算法进行了比较,结果表明在由6台工作站组成的网络中DPP算 相似文献
5.
VPP500向量并行处理机是一台高度并行的分布式存储器巨型计算机,性能范围是6.4 ̄355GFLOPS,主存容量为1 ̄222GB。该系统可支持4 ̄222个由高带宽交叉开关网络互连的处理器。VPP500与当前大规模并行系统截然不同的三个关键特征决定了其体系结构。第一,它的组成部件是1.6GFLOPS的向量处理器,比大规模并行处理机(MPP)中使用的处理器快一个数量级。这种极高的单处理器性能降低了系统 相似文献
6.
7.
多级互连网络中的multicast通信 总被引:3,自引:1,他引:3
MPP系统中的并行通信是目前并行处理研究的热点,改善并行通信性能,提高网络吞吐率是促进MPP性能发挥的关键问题。multicast通信是区别于点到点通信的一对多通信方式,因而功能更强大,使用起来更灵活方便,在并行处理中应用十分广泛。文中以基于开关元件实现结点间动态互连的多级互连网络为背景,研究了multicast通信路上算法的效率。 相似文献
8.
9.
戴江红 《中国图象图形学报》1997,(4)
Intergraph公司推出新型三维PC机Intergraph公司于1997年3月31日正式宣布,推出新型的三维PC机,它基于Windows/Win-dowsNT,并配有Intel的最新Pentium处理器。该处理器带有MMXTM多媒体增强技术。In... 相似文献
10.
Base-nm-Cube是一种新型的MPP互连网络,具有平均距离短,易实现等优点。 相似文献
11.
T63全球海气耦合预报模式的并行计算 总被引:1,自引:0,他引:1
介绍了基于T63全球海气耦合业务预报模式的特点及基本原理,在分析了它的基本流程及串行运行时间的基础上,针对其巨大的计算量以及数据流特点,提出了基于纬圈并行的并行方案,并对I/O作了比较有效的优化,在神威并行机上实现后,在8处理器时取得了较好的效果,最大可扩展至48处理器。 相似文献
12.
13.
1 引言大规模并行计算机(MPP)系统性能的发挥极大程度上依赖于互连网络的通信性能,互连网络采用的路由算法决定了消息在网络中如何选取路径,其性能对网络效率的发挥起着重要作用,根据允许选择路径的不同,路由算法有最短路径和非最短路径以及确定性和自适应性之分,自适应又有部分自适应和完全 相似文献
14.
15.
近年来,遥感图像几何校正的并行处理成为重点研究的对象·但现有的并行算法尚存在一些问题,这些算法不具备负载平衡能力或者全局计算量大,而且局部操作非常耗时·针对以上不足提出了一种基于动态分界点计算的并行几何校正算法PI WA-DDC·通过LogP模型,推导出PI WA-DDC算法具有良好的可扩展性·通过在MPP上的测试数据,验证了该算法具有良好的负载平衡能力和高效处理几何畸变的能力· 相似文献
16.
Waheed A. Rover D.T. Hollingsworth J.K. 《IEEE transactions on pattern analysis and machine intelligence》1998,24(6):451-470
This paper demonstrates the use of a model-based evaluation approach for instrumentation systems (ISs). The overall objective of this study is to provide early feedback to tool developers regarding IS overhead and performance; such feedback helps developers make appropriate design decisions about alternative system configurations and task scheduling policies. We consider three types of system architectures: network of workstations (NOW), symmetric multiprocessors (SMP), and massively parallel processing (MPP) systems. We develop a Resource OCCupancy (ROCC) model for an on-line IS for an existing tool and parameterize it for an IBM SP-2 platform. This model is simulated to answer several “what if” questions regarding two policies to schedule instrumentation data forwarding: collect-and-forward (CF) and batch-and-forward (BF). In addition, this study investigates two alternatives for forwarding the instrumentation data: direct and binary tree forwarding for an MPP system. Simulation results indicate that the BF policy can significantly reduce the overhead and that the tree forwarding configuration exhibits desirable scalability characteristics for MPP systems. Initial measurement-based testing results indicate more than 60 percent reduction in the direct IS overhead when the BF policy was added to Paradyn parallel performance measurement tool 相似文献
17.
LSMPP并行C语言设计 总被引:1,自引:0,他引:1
LSMPP并行C语言是针对LSMPP嵌入式并行计算机而设计的并行语言,在选取特定的C语言子集的基础上进行并行扩充得到,并增加了图像处理函数库及算术运算函数库,形成的面向图像处理的并行语言。 相似文献
18.
Shao B.B.M. Rao H.R. 《IEEE transactions on systems, man, and cybernetics. Part A, Systems and humans : a publication of the IEEE Systems, Man, and Cybernetics Society》2006,36(1):233-242
It has been suggested that parallel processing helps in the solution of difficult discrete optimization problems, in particular, those problems that exhibit combinatorial search and require large-scale computations. By using a number of processors that are connected, coordinated and operating simultaneously, the solutions to such problems can be obtained much more quickly. The purpose of this paper is to propose an efficient parallel hypercube algorithm for the discrete resource allocation problem (DRAP). A sequential divide-and-conquer algorithm is first proposed. The algorithm is then modified for a parallel hypercube machine by exploiting its inherent parallelism. To allocate N units of discrete resources to n agents using a d-dimensional hypercube of p=2/sup d/ nodes, this parallel algorithm solves the DRAP in O((n/p+log/sub 2/p)N/sup 2/) time. A simulation study is conducted on a 32-node nCUBE/2 hypercube computer to present the experimental results. The speedup factor of the parallel hypercube algorithm is found to be more significant when the number of agents in the DRAP is much greater than the number of processing nodes on the hypercube. Some issues related to load balancing, routing, scalability, and mappings of the parallel hypercube algorithm are also discussed. 相似文献