首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
CGBenchmark是NASParalelBenchmarks(NPB)中的一个核心程序,它用共轭梯度法求大型稀疏对称正定矩阵的最小特征值,本文介绍其主要算法,并给出在分布式环境下的高效并行算法,最后给出了在SGIChalengePVM平台上的测试结果  相似文献   

2.
MUSIC算法在分布式并行处理机上的实现研究   总被引:3,自引:0,他引:3  
介绍了一种基于分布式并行处理平台的并行MUSIC实现方法。在实现过程中,针对MUSIC算法运算量大难以实时实现的特点,采取了有效减少计算量的措施。并根据MUSIC算法各个子任务的不平衡性,提出了一种基于软件流水的并行任务划分方法。经仿真试验证明,经过上述并行处理后可有效加快算法的完成时间,在工程实践中具有广泛的实际意义。  相似文献   

3.
并行分布式体绘制算法的设计   总被引:1,自引:0,他引:1  
体绘制是一种需要大量计算资源和内存资源的可视化任务,本文提出一种并行分布式体绘制算法,对绘制任务进行适当剖分,使用连网的工作站进行计算,有效地加快了图形绘制速度。  相似文献   

4.
李文  郭立  袁红星  关华 《计算机工程》2012,38(1):182-184
针对多视环境下特征点提取计算耗时较长的问题,提出其并行实现方法。通过灰度共生矩阵构造纹理特征差异度,选取关键视点和消除冗余视点,采用Harris角点提取算法、团块检测算法,提取关键视点图像的特征点,利用关键视点选取及特征点提取过程存在的并行性,对算法进行并行实现。实验结果表明,该方法能有效地选取关键视点,在双核处理器上使平均加速比达到1.88。  相似文献   

5.
基于Hadoop分布式计算平台,给出一种适用于大数据集的并行挖掘算法。该算法对非结构化的原始大数据集以及中间结果文件进行垂直划分以确保能够获得完整的频繁项集,将各个垂直分块数据分配给不同的Hadoop计算节点进行处理,以减少各个计算节点的存储数据,进而减少各个计算节点执行交集操作的次数,提高并行挖掘效率。实验结果表明,给出的并行挖掘算法解决了大数据集挖掘过程中产生的大量数据通信、中间数据以及执行大量交集操作的问题,算法高效、可扩展。  相似文献   

6.
PVM环境下求复函数方程根的并行遗传算法   总被引:2,自引:0,他引:2  
本文提出了一种在PVM环境下,用基于模拟退火思想的PGA实现了求复函数方程根的并行算法,并得到令人满意的结果.在本文中研究和探讨了核算法实现的数学理论和关键的实现技术.  相似文献   

7.
文中分析了传统基于并行基准测试程序测试方法的不足,针对目前高性能计算机处理机台数多的特点,给出了实用的测试方法,推广了传统加速比的概念,提出了一种可扩展性评价方法。使用文中给出的方法,可方便地对高性能计算机进行测试和性能评价,同时可以使用小规模的并行机测试结果预测大规模并行机的性能。最后给出了NPB在某高
性能计算机上的测试和性能评价结果。  相似文献   

8.
美国宇局(NASA)Ames的研究人员定义了一组评价超有计算机性能的基准测试程序,这些基准测试程序包括五个内核和三个模拟应用,本文介绍了三个应用之一BTBenchmark的数学模型及三种并行实现方法,给出了三种算法的一些测试结果和性能分析。  相似文献   

9.
分布式存储环境下矩阵转置并行算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
本文针对基于消息传递机制的分布式高性能计算中经常遇到的矩阵转置问题,在分析环状算法的基础上,提出了一种新的蝶形并送算法。  相似文献   

10.
分布式并行粒子滤波算法结构分析与研究   总被引:3,自引:0,他引:3  
粒子滤波器是解决非线性/非高斯系统状态估计的有效技术,广泛应用于目标跟踪、无线通信.自动控制等领域.但因其计算复杂、计算量庞大等缺陷,无法满足实时系统的应用需求.针对粒子滤波器计算量大、实时性差的问题,提出了一种基于MPI的分布式并行粒子滤波算法,给出了Master-Slave并行模式下任务分配、数据划分与负载平衡策略.实验结果表明,若忽略通信代价,加速比基本呈线性增长.  相似文献   

11.
数据分布型sort-first并行图形绘制系统的研究与实现   总被引:11,自引:1,他引:10  
sort-first体系结构常用来构建高性能并行图形绘制系统,基于immediate-mode的数据集中型Sort-first系统,对网络带宽高度依赖,网络带宽和归属计算易成为系统瓶颈,提出了一个基于retain-mode的数据分布型并行绘制系统,工作原理是将几何数据分布于绘制结点,并利用帧间相似性动态调整绘制结点上的数据分布以适应视角的改变,有效地降低了数据分布所需的传输开销,系统利用Cell结构来控制并行粒度,实验结果显示能以相对较低的并行开销实现高分辨率显示和并行加速。  相似文献   

12.
本文首先简要介绍面向对象语言Smalltalk-80系统的顺序实现技术,然后重点论述它的并发、分布及并行实现技术。  相似文献   

13.
In this paper, a new hybrid parallelisable low order algorithm, developed by the authors for multibody dynamics analysis, is implemented numerically on a distributed memory parallel computing system. The presented implementation can currently accommodate the general spatial motion of chain systems, but key issues for its extension to general tree and closed loop systems are discussed. Explicit algebraic constraints are used to increase coarse grain parallelism, and to study the influence of the dimension of system constraint load equations on the computational efficiency of the algorithm for real parallel implementation using the Message Passing Interface (MPI). The equation formulation parallelism and linear system solution strategies which are used to reduce communication overhead are addressed. Numerical results indicate that the algorithm is scalable, that significant speed-up can be obtained, and that a quasi-logarithmic relation exists between time needed for a function call and numbers of processors used. This result agrees well with theoretical performance predictions. Numerical comparisons with results obtained from independently developed analysis codes have validated the correctness of the new hybrid parallelisable low order algorithm, and demonstrated certain computational advantages.  相似文献   

14.
针对多片TMS320C64 DSP构成的多计算机体系结构的实时图像识别系统,设计并实现了面向并行图像处理的实时分布式操作系统PIPORTDOS(Parallel image processing-oriented real-time distributed operating system).PIPORTDOS基于微内核体系结构,包括硬件抽象层、系统核心层、分布式消息通信机制和系统服务层四个层次.其多任务内核实现了基于优先级的抢先式调度、任务闻的同步和通信原语、实时的中断处理以及面向应用的缓存管理机制.为了实现对分布式并行图像处理的支持,PIPORTDOS采用了基于消息传递(Message Passing)的方式,并在实现中充分考虑了上层图像处理算法的应用需求以及DSP的硬件功能.相关性能指标表明,本文设计实现的PIPORTDOS完全可以满足系统的强实时性要求.在功能上也能适应算法对不同并行结构的需求.  相似文献   

15.
并行数据库上的并行CMD-Join算法   总被引:3,自引:1,他引:3  
李建中  都薇 《软件学报》1998,9(4):256-262
并行数据库在多处理机之间的分布方法(简称数据分布方法)对并行数据操作算法的性能影响很大.如果在设计并行数据操作算法时充分利用数据分布方法的特点,可以得到十分有效的并行算法.本文研究如何充分利用数据分布方法的特点,设计并行数据操作算法的问题,提出了基于CMD多维数据分布方法的并行CMD-Join算法.理论分析和实验结果表明,并行CMD-Join算法的效率高于其它并行Join算法.  相似文献   

16.
本文分析了BGP协议在因特网环境中面临的巨大路由表容量、消耗大量控制平面计算资源、支持邻居会话数量有限等难以解决的问题;基于集群路由器体系结构的特点,提出并讨论了BGP协议的四种分布式实现技术;最后对这几种实现技术进行了比较,指出了分布式实现技术相对于传统集中控制方式的优势及特点。  相似文献   

17.
Very fast and accurate 3-D capacitance extraction is essential for interconnect optimization in VLSI ultra-deep sub-micron designs (UDSM). Parallel processing provides an approach to reducing the simulation turn-around time. This paper examines the parallelization of the well-known fast multipole-based 3-D capacitance extraction program FASTCAP, which employs new adaptive and preconditioning techniques. To account for the complicated data dependencies in the unstructured problems, we propose a novel generalized cost function model, which can be used to accurately measure the workload associated with each cube in the hierarchy. We then present two adaptive partitioning schemes, combined with efficient communication mechanisms with bounded buffer size, to reduce the parallel processing overhead. The overall load balance is achieved through balancing the load at each level of the multipole computation. We report detailed performance results on a variety of distributed memory parallel platforms, using standard benchmarks on 3-D capacitance extraction.  相似文献   

18.
分布式并行绘制系统中几何指令流压缩的研究与实现   总被引:2,自引:4,他引:2  
对分布式并行绘制系统的几何指令进行压缩能缓解网格带宽瓶颈,对操作码作用LZW算法,对法向量使用球面对称网格剖分算法,对颜色和位置数据使用DPCM型预测编码算法,根据位置数据的特殊性,使用了4类预测器和自适应量化算法,对几何指令流组合使用多种压缩算法取得了良好的效果。在几何模型质量基本没有损失的情况下,指令平均长度压缩到原来的1/3左右,执行速度达到了400指令/ms。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号