首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
曙光1000A上消息传递与共享存储的比较   总被引:12,自引:2,他引:12  
分布式共享存储虽然有易于编程的优点,但往往被认为效率不高、完全由软件实现的分布式共享存储系统(又称为虚拟共享存储系统)更是如此,文中以典型的消息传递系统PVM与分布式共享存储系统JIAJIA粉列,报这两种并行程序设计环境的特点,并用7个应用程序在曙光1000A上分别比较了这两个系统的性能,实验3结果表明,JIAJIA的与PV玎当,但基于JIAJIA的并行程序设计却比PVN简单得多。  相似文献   

2.
在分布式并行计算系统中,任务运行时支撑平台的功能和效率对并行执行的效果有着重要的影响,Java言中的线程机制和RMI机制为NOW环境下的分布并行应用提供了高效的支持^「1」。在基于Java的自动并行编译系统JAPS^「2」中,设计和实现了分别基于Java RMI和Socket通信支持策略的并行任务支撑平台PTSP;并比较了这两种通信策略对在NOW环境下的分布式并行计算的支持能力和系统效率。  相似文献   

3.
COLLISIONDETECTIONAMONGMOVINGOBJECTSINMACHININGPROCESSSIMULATIONYangHeming;LuAnsheng;ZhouJiCOLLISIONDETECTIONAMONGMOVINGOBJEC...  相似文献   

4.
景龙 《电脑》2000,(9):17-17
台湾大众电脑(FIC)是著名的主板生产厂商之一,我想一些经常攒机的老鸟们一定不会陌生,最近该公司推出了基于VIA Apollo Pro 133A VIA芯片组,支持INTEL和 CYRIX JOSHUA、 CYRIXSAMUEL处理器的FA11和FA31主板。 大众FA11主板采用VIA 694X北桥和596B南桥芯片,ATX结构。主板上面提供了三条DIMM插槽,最多支持达1.5GB的SDRAM,当然也支持VIA倡导的PC133标准。一条AGP2X/4X插槽,五条PCI以及一条ISA插槽,提供了良好的全…  相似文献   

5.
油藏模拟线性解法包的并行实现徐向明,孙家昶(中国科学院软件所并行软件研究开发中心)PARALLELIMPLEMENTATIONOFLINEARSOLVERFORPETROLEUMRESERVOIRSIMULATION¥XuXiangming;SunJ...  相似文献   

6.
《电脑》2001,(2)
VIA PRO266由北桥VT8633和南桥VT8233组成,支持SOCKET370接口的 Intel Pentium Ⅲ、Celeron和 VIA CyrixⅢ系列。采用DDR内存架构,FSB速度为133MHz,DDR内存的运行速度就是266MHz。内存带宽成倍的增加,峰值达到2.1GB/s。最大支持2GB内存。并且,DDR内存的工作电压是2.5V,可以有效的降低系统功耗。从系统上看,MCH同时支持SDRAM和DDRRAM,不排除有出现带有SDRAM插槽的主板出现。 在北桥和南桥之间采用了V-IJN…  相似文献   

7.
一种新的求解线性时变系统的数值解法贾磊,孙优贤(山东轻工业学院机电系)(浙江大学工业控制研究所)ANEWNUMERICALMETHODOFTHELINEARTIME-VARINGSYSTEMSVIASHIFTEDJACOBISERIES¥JiaLei...  相似文献   

8.
本文详细介绍了VAX机上有VMS操作系统支持下生成可共享映象的关键技术,并介绍了YFSIM软件交互子系统部分共享映象的生成及使用过程中所遇到的一些问题和解决的办法。  相似文献   

9.
Java RMI实现了Java同构环境下的分布式的对象计算。本文对Java RMI体系结构进行了探讨,分析了创建RMI应用程序的方法和步骤,以及编译、发布和运行RMI应用程序的具体过程。  相似文献   

10.
《计算机》2001,(24):33-33
华硕Socket A系列主板平均降幅有100元左右,降价后A7V一E/KT133为840元,A7S-VM/SIS730S为740元,A7VI-VM/KM133为790元, A7VL—VM/KL133为690元。捷波推出了999元的KT266主板──J866AS。最新上市的精英K7AMA主板采用黑色PCB板,南北桥使用的是ALI的芯片组,BIOS则是AMI的,集成网卡;它上面只有4根PCI槽;DDR及SDRAM插槽各有两根,售价880元。主板价格战激烈  相似文献   

11.
针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优化算法。该算法根据给出的过程间副作用集合和基于mpi_wait/mpi_irecv移动的重排序变换规则,有序地采用重排序变换和循环分布,尽可能安全地扩大点到点非阻塞通信中通信与计算的重叠窗口,使MPI自动并行化编译器生成具有更多计算重叠通信的消息传递代码。实验结果表明,该算法能够隐藏更多的点到点非阻塞通信开销,并且明显提升消息传递程序的加速比。  相似文献   

12.
13.
1 概述在现代计算技术中,分布并行处理越来越成为一种关键性的技术.这种由许多小任务合作解决大问题的方法,在过去几年发挥着越来越重要的作用,从高性能科学计算到日常事务的应用程序,都广泛接受和采纳分布并行处理,这是由于对高性能、低代价及强计算能力的需求所导致的,而大规模并行处理机(MPP)的  相似文献   

14.
JavaPIE是并行程序设计交互环境在Internet上的延伸,其设计目标是并行程序设计交互环境Para-PIE和自动并行化编译工程AFP的底层支持,通过Java实现的交互工具达到更理想的移植性、开放性和及共享性。它将并行化编译方法、程序语义分析技术、交互信息可视化工具、实验分析脚本文档有机地结合在一起,并在Internet上延伸出来,为蓬勃地开展并行程序设计交互环境的国际化合作研究开辟了广阔的前  相似文献   

15.
为了提高消息传递型多处理器的性能,优化处理器间的通信对于并行化编译器至关重要。介绍了建立在精确数组数据流分析基础上的通信优化技术。通过优化,减少了通信次数,降低了通信代价。最后通过一个实例说明,在一定计算划分下结合精确数据流分析实现通信比仅仅依据计算划分实现通信能更有效地减少通信量。  相似文献   

16.
并行化编译中的一种集成优化方法   总被引:1,自引:0,他引:1  
孙彤  李三立  李晓明 《软件学报》1996,7(12):705-713
本文提出了一种面向分布存储器多机系统的并行化编译方法.针对分布存储并行系统的特点,作者采用的基本优化策略是:折衷并行性与数据引用局部性;减少和隐藏通信开销.通过对基于仿射函数的程序分解方式所导致的数据通信性质的分析,得到了适合分布存储结构特殊要求的并行性开发方法.为了在保持并行性的前提下最小化通信数据总量,提出了基于齐次线性方程组求解的程序全局优化分解方法.为了优化数据通信的组织,提高结点代码的效率,又提出了一种以线性不等式组作为工具的更加实用的通信优化和结点代码生成方法.  相似文献   

17.
The quality of many optimizations and analyses of parallelizing compilers depends significantly on the ability to evaluate symbolic expressions and on the amount of information available about program variables at arbitrary program points. In this paper, we describe an effective and unified symbolic evaluation framework that statically determines the values of variables and symbolic expressions, assumptions about and constraints between variable values, and the condition under which control flow reaches a program statement. We introduce the program context, a novel representation for comprehensive and compact control and data flow analysis information. Program contexts are described as first order logic formulas, which allows us to use public domain software for standard symbolic manipulation. Computations are represented as algebraic expressions defined over a program's problem size. Our symbolic evaluation techniques comprise accurate modeling of assignment and input/output statements, branches, loops, recurrences, arrays, and procedures. All of our techniques target both linear, as well as nonlinear, expressions and constraints. Efficiency of symbolic evaluation is highly improved by aggressive simplification techniques. A variety of examples, including program verification, dependence analysis, array privatization, communication vectorization, and elimination of redundant communication, are used to illustrate the effectiveness of our approach. We present results from a preliminary implementation of our framework, which is used as part of a parallelizing compiler that demonstrates the potential performance gains achievable by employing symbolic evaluation to support program parallelization.  相似文献   

18.
Generation of efficient parallel code is a major goal of a well-designed and developed parallelizing compiler. Another important goal is portability of both compiler system and the resulting output source codes. The various choices of current and future parallel computer architectures as well as the cost of developing a parallelizing compiler make portability a very important design goal. Since the design of parallelizing compilers is considerably move complex than designing conventional compilers, it is very important to achieve both efficiency and portability. To meet this dual goal, we have investigated the application of object oriented design to parallelizing compilers. Our parallelizing compiler design is based on abstractions of intermediate representations of loops and their class definitions. In this paper, we address the problem of loop parallelization and propose a framework where the loop parallelization process is divided into three phases and the optimization of loops is performed via a cyclic application of these three phases. The class of each phase is hierarchically derived from intermediate representations of loops. This facilitates the portability of the resulting parallelizing compilers. Furthermore, one of the phases uses a reservation table of hardware resources in order to obtain optimized parallel programs for given hardware resources. The validation of the proposed framework is given through the application of the object oriented design on an example program which is then parallelized efficiently.  相似文献   

19.
随着网络技术的发展,在异构平台上使用共同的计算和信息资源将很快成为可能。Grid(网格)就是这样一种提供资源共享的新兴平台,而在其之上的下一代软件程序(NGS)则对编译器提出了新的挑战犤1犦。未来Grid平台上的编译系统将是能够进行动态编译和优化,根据实时系统以及网络的性能不断进行自我调整的软件模型,同时它还能为具有自适应性的应用程序提供编译支持。  相似文献   

20.
Data distribution has been one of the most important research topics in parallelizing compilers for distributed memory parallel computers. Good data distribution schema should consider both the computation load balance and the communication overhead. In this paper, we show that data redistribution is necessary for executing a sequence of Do-loops if the communication cost due to performing this sequence of Do-loops is larger than a threshold value. Based on this observation, we can prune the searching space and derive efficient dynamic programming algorithms for determining effective data distribution schema to execute a sequence of Do-loops with a general structure. Experimental studies on a 32-node nCUBE-2 computer are also presented  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号