期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王文义周兵《计算机工程与应用》1998,34(3):44-46

如何在实际应用中发挥大规模并行机（ＭａｓｓｉｖｅｌｙＰａｒａｌｌｅｌＰｒｏｃｅｓｓｏｒ，简称ＭＰＰ）的最佳性能，是当今国内外急待需要解决的课题之一。本文仅从应用者的角度出发，对可以改善ＭＰＰ有效速度的若干方法进行了探讨，这时使用ＭＰＰ系统以及基于ＲＩＳＣ芯片工作站的广大用户将具有一定的参考价值。相似文献

2.

MPP系统中的MP通信及其实现

周庭松《计算机工程》1998,24(11):44-46

论述了ＭＰＰ系统中节点机的通信结构，以及在主控机与节点机之间实现的ＭｅｓｓａｇｅＰａｓｓｉｎｇ通信及其通信协议。相似文献

3.

大规模并行处理系统及其程序设计方法研究——Cache缺失延迟、层次算法和可定域性

王文义董绍静《计算机研究与发展》1999,36(5):1200

实践表明,大规模并行处理系统（ｍａｓｓｉｖｅｌｙｐａｒａｌｅｌｐｒｏｃｅｓｉｎｇｓｙｓｔｅｍ,ＭＰＰ）的实际有效速度与其理论峰值速度往往存在着较大差距,有时仅能达到峰值速度的２５％左右．鉴于目前许多领域的高性能科学计算都要把ＭＰＰ系统作为主要的实现工具,因此上述问题已引起国内外专家的普遍关注．文中讨论了影响大规模并行处理系统有效速度主要因素之一的Ｃａｃｈｅ缺失问题,并以ＥｘｅｍｐｌａｒＳＰＰ１２００／ＸＡ为例,在层次算法和可定域性两个方面实验并总结了提高系统应用性能的若干程序设计方法．相似文献

4.

求解三对角线性方程组的双向并行分裂法 总被引：3，自引：0，他引：3

迟利华李晓梅《计算机工程与设计》1999,20(1):49-55

首先回顾了Ｈ．Ｈ．Ｗａｎｇ的分裂法＾［８］Ｍｉｃｈｉｅｌｓｅ＆Ｖｏｒｓｔ给出的改进算法＾［９］，分析了影响分裂法及改进算法的并行效率的主要因素，然后提出了一种求解三对角方程组的双向并行分裂法（简记为ＤＰＰ算法），ＤＰＰ算法的通讯建立的次数为Ｍ＆Ｖ算法的５０％，数据传输量为其３０％，最后在工作站网络环境下实现了ＤＰＰ算法，并就并行效率与Ｍ＆Ｖ算法进行了比较，结果表明在由６台工作站组成的网络中ＤＰＰ算相似文献

5.

VPP500并行巨型机的体系结构

王广益《电子计算机》1996,(6):42-50

ＶＰＰ５００向量并行处理机是一台高度并行的分布式存储器巨型计算机，性能范围是６．４￣３５５ＧＦＬＯＰＳ，主存容量为１￣２２２ＧＢ。该系统可支持４￣２２２个由高带宽交叉开关网络互连的处理器。ＶＰＰ５００与当前大规模并行系统截然不同的三个关键特征决定了其体系结构。第一，它的组成部件是１．６ＧＦＬＯＰＳ的向量处理器，比大规模并行处理机（ＭＰＰ）中使用的处理器快一个数量级。这种极高的单处理器性能降低了系统相似文献

6.

真实性能　卓越表现

《计算机》2002,(3)

近１００名电脑使用者元月１４日聚集在上海，与ＡＭＤ公司一同体验２００２年最酷炫的ＡＭＤ速龙ＸＰ处理器的超强性能。会中，ＡＭＤ公司中国区产品市场经理纪朝辉先生对这款产品的功能与应用做了精彩演说。随着Ｗｉｎｄｏｗ　ＸＰ上市之后，计算机使用者对处理器的功能需求更高，ＡＭＤ速龙ＸＰ中的ＸＰ是指该处理器的ｅＸｔｒｅｍｅ　Ｐｅｒｆｏｒｍａｎｃｅ（卓越性能），能为Ｍｉｃｒｏｓｏｆｔ　Ｗｉｎｄｏｗｓ　ＸＰ操作系统带来卓越的性能表现。纪朝辉表示，ＡＭＤ速龙ＸＰ处理器的性能在众多的实际应用中比同频率的产品高出了２… 相似文献

7.

多级互连网络中的multicast通信 总被引：3，自引：1，他引：3

王晓东周兴铭《计算机研究与发展》1998,35(1):40-44

ＭＰＰ系统中的并行通信是目前并行处理研究的热点，改善并行通信性能，提高网络吞吐率是促进ＭＰＰ性能发挥的关键问题。ｍｕｌｔｉｃａｓｔ通信是区别于点到点通信的一对多通信方式，因而功能更强大，使用起来更灵活方便，在并行处理中应用十分广泛。文中以基于开关元件实现结点间动态互连的多级互连网络为背景，研究了ｍｕｌｔｉｃａｓｔ通信路上算法的效率。相似文献

8.

嵌入式市场上的新贵——SPAR CengineTM UltraTM Axmp

《网络与信息》1998,12(9):49

ｕｎＭｉｃｒｏｓｙｓｔｅｍｓ公司在７月份推出的新产品ＳＰＡＲＣｅｎｇｉｎｅＵｌｔｒａＡｘｍｐ，是一个板级解决方案，它能使原始设备制造商（ＯＥＭ）在ＳＰＡＲＣ处理器和Ｓｏｌａｒｉｓ操作系统相结合的基础上开发高性能四路多处理嵌入式系统。采用该方案开发的应... 相似文献

9.

Intergraph公司推出新型三维PC机

下载免费PDF全文

戴江红《中国图象图形学报》1997,(4)

Ｉｎｔｅｒｇｒａｐｈ公司推出新型三维ＰＣ机Ｉｎｔｅｒｇｒａｐｈ公司于１９９７年３月３１日正式宣布，推出新型的三维ＰＣ机，它基于Ｗｉｎｄｏｗｓ／Ｗｉｎ－ｄｏｗｓＮＴ，并配有Ｉｎｔｅｌ的最新Ｐｅｎｔｉｕｍ处理器。该处理器带有ＭＭＸＴＭ多媒体增强技术。Ｉｎ... 相似文献

10.

基于Base-mn-Cube的路由算法

下载免费PDF全文

唐玉华徐炜遐《计算机工程与科学》1998,20(3):32-35

Ｂａｓｅ－ｎｍ－Ｃｕｂｅ是一种新型的ＭＰＰ互连网络，具有平均距离短，易实现等优点。相似文献

11.

T63全球海气耦合预报模式的并行计算 总被引：1，自引：0，他引：1

张天刚徐金秀《计算机工程与应用》2004,40(25):193-195

介绍了基于T63全球海气耦合业务预报模式的特点及基本原理,在分析了它的基本流程及串行运行时间的基础上,针对其巨大的计算量以及数据流特点,提出了基于纬圈并行的并行方案,并对I/O作了比较有效的优化,在神威并行机上实现后,在8处理器时取得了较好的效果,最大可扩展至48处理器。相似文献

12.

一种实用的并行计算模型 总被引：11，自引：0，他引：11

计永昶丁卫群陈国良安虹《计算机学报》2001,24(4):437-441

对于当前流行的工作站集群环境和各类并行机系统,文中提出了一种实用的并行计算模型,即基于LogGP的非独占异质同步模型NHBL（Nondedicated Heterogeneous Barrier LogGP）,它旨在反映具有异质性和非独占性的NOW计算环境对并行算法设计和分析的影响,然后用NHBL模型分析了PSRS算法在国家高性能计算中心（合肥）的工作站集群NHPCC-Cluster和曙光－1000MPP由的代价,并用实测结果进行了验证。相似文献

13.

BNR：最短路径无死锁全自适应路由算法的分析与设计工具

邓波杨晓东《计算机科学》2000,27(12):20-23

1 引言大规模并行计算机(MPP)系统性能的发挥极大程度上依赖于互连网络的通信性能,互连网络采用的路由算法决定了消息在网络中如何选取路径,其性能对网络效率的发挥起着重要作用,根据允许选择路径的不同,路由算法有最短路径和非最短路径以及确定性和自适应性之分,自适应又有部分自适应和完全相似文献

14.

流水通道--一种高速的MPP系统互连

刘燕徐炜遐杨晓东《计算机学报》1998,21(11):995-1002

传统大规模并行处理机系统中的互连网络及路由器在强同步方式下工作，相邻部由器间消息的传送必须保证一个周有完成，系统互连长度成为影响网络主频的重要因素，同时也限制了系统的可扩展性，采用流水通道可在一条通道上同时传送多个数据，使得网络的主频独立于线的长度，提高了网络的传输速率，本文介绍了一这思想，并对流水通道互连网络的实现技术进行了研究，着重阐述了源同步传输，切换技术，流控策略等几个关键技术问题。相似文献

15.

基于动态分界点计算的并行几何校正算法

欧新良陈松乔常志明《计算机研究与发展》2006,43(6):1115-1121

近年来,遥感图像几何校正的并行处理成为重点研究的对象·但现有的并行算法尚存在一些问题,这些算法不具备负载平衡能力或者全局计算量大,而且局部操作非常耗时·针对以上不足提出了一种基于动态分界点计算的并行几何校正算法PI WA-DDC·通过LogP模型,推导出PI WA-DDC算法具有良好的可扩展性·通过在MPP上的测试数据,验证了该算法具有良好的负载平衡能力和高效处理几何畸变的能力· 相似文献

16.

Modeling and evaluating design alternatives for an on-lineinstrumentation system: a case study

Waheed A. Rover D.T. Hollingsworth J.K. 《IEEE transactions on pattern analysis and machine intelligence》1998,24(6):451-470

This paper demonstrates the use of a model-based evaluation approach for instrumentation systems (ISs). The overall objective of this study is to provide early feedback to tool developers regarding IS overhead and performance; such feedback helps developers make appropriate design decisions about alternative system configurations and task scheduling policies. We consider three types of system architectures: network of workstations (NOW), symmetric multiprocessors (SMP), and massively parallel processing (MPP) systems. We develop a Resource OCCupancy (ROCC) model for an on-line IS for an existing tool and parameterize it for an IBM SP-2 platform. This model is simulated to answer several “what if” questions regarding two policies to schedule instrumentation data forwarding: collect-and-forward (CF) and batch-and-forward (BF). In addition, this study investigates two alternatives for forwarding the instrumentation data: direct and binary tree forwarding for an MPP system. Simulation results indicate that the BF policy can significantly reduce the overhead and that the tree forwarding configuration exhibits desirable scalability characteristics for MPP systems. Initial measurement-based testing results indicate more than 60 percent reduction in the direct IS overhead when the BF policy was added to Paradyn parallel performance measurement tool 相似文献

17.

LSMPP并行C语言设计 总被引：1，自引：0，他引：1

程翔胡宝成《计算机工程与应用》2003,39(4):143-144,188

LSMPP并行C语言是针对LSMPP嵌入式并行计算机而设计的并行语言,在选取特定的C语言子集的基础上进行并行扩充得到,并增加了图像处理函数库及算术运算函数库,形成的面向图像处理的并行语言。相似文献

18.

A parallel hypercube algorithm for discrete resource allocation problems

Shao B.B.M. Rao H.R. 《IEEE transactions on systems, man, and cybernetics. Part A, Systems and humans : a publication of the IEEE Systems, Man, and Cybernetics Society》2006,36(1):233-242

It has been suggested that parallel processing helps in the solution of difficult discrete optimization problems, in particular, those problems that exhibit combinatorial search and require large-scale computations. By using a number of processors that are connected, coordinated and operating simultaneously, the solutions to such problems can be obtained much more quickly. The purpose of this paper is to propose an efficient parallel hypercube algorithm for the discrete resource allocation problem (DRAP). A sequential divide-and-conquer algorithm is first proposed. The algorithm is then modified for a parallel hypercube machine by exploiting its inherent parallelism. To allocate N units of discrete resources to n agents using a d-dimensional hypercube of p=2/sup d/ nodes, this parallel algorithm solves the DRAP in O((n/p+log/sub 2/p)N/sup 2/) time. A simulation study is conducted on a 32-node nCUBE/2 hypercube computer to present the experimental results. The speedup factor of the parallel hypercube algorithm is found to be more significant when the number of agents in the DRAP is much greater than the number of processing nodes on the hypercube. Some issues related to load balancing, routing, scalability, and mappings of the parallel hypercube algorithm are also discussed. 相似文献