首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 82 毫秒
1.
长期以来,speedup一直被视为衡量并地处理性能的主要指标之。不论是并行计算机系统的设计者,还是并行算法的设计者,均非常重视speedup指标。那么,speedup能否像人们仃的那样正确的描述并行处理的性能呢?迄今为止,人们对这一问题尚缺乏认识。本文从speedup的定义出发,结合实例,全面分析了speedup度量并行处理的性能存在的问题,以及可能导致的错误,还讨论了speedup的适应条件。  相似文献   

2.
xpTools:代码压缩系统定制环境   总被引:1,自引:0,他引:1  
代码压缩技术通过对整个应用程序全部或者部分指令进行压缩,能够有效地减少内存的尺寸、功耗等。但是,代码压缩技术却没有得到广泛的应用,主要原因是缺乏有效的定制环境.本文针对代码压缩的需求提出了一套可重定向的工具集xpTools用于代码压缩系统的定制,该工具集(包括编译器、仿真器、分析工具、综合工具等)可根据设计者选择的指令集自动生成,利用这些工具设计者能够针对具体应用权衡代码压缩技术对系统的性能、功耗、尺寸等方面的影响,进而定制最佳的代码压缩系统.  相似文献   

3.
软硬件协同设计中的性能分析常常使设计者将过多的精力用于对大量数据的整理和分析,从而降低了设计效率。集成的软硬件协同设计环境iCDMdt中的性能分析工具以验证平台采集的分析数据和用户设置为输入,在同一环境下以内嵌的分析图形输出,用简捷明了的方式帮助设计者实现性能分析。本文对iCDMdt环境中性能分析工具及其实现进行了详细叙述,并以普通电话机模型作为集成的软硬件协同设计环境iCDMdt的设计实例应用其性能分析工具。  相似文献   

4.
在OLTP应用中数据库集群是一种有效的并行处理方案,由于以前对数据库集群特别是异构情况下的性能评价不够完善,本文主要研究数据库异构集群的性能模型,分析了CPU和内存两种资源的异构带来性能影响,并给出了异构集群并行性的度量标准及系统有效性评估公式。最后,通过TPC-C实验表明数据库异构集群在OLTP处理中仍具有良好的可扩展性,次线性的加速比,以及高效费比的并行处理服务。  相似文献   

5.
数据库的的工作性能直接决定应用系统的工作性能。并行处理可以提高Oracle数据库的工作性能。本文在对Orade并行原理、并行参数设置的基础上,对Orade并行处理功能的使用方法、使用条件提出了自己的观点,为用户合理使用并行处理提供了方便.  相似文献   

6.
大规模并行处理系统中的通讯开销是影响系统性能的一个重要因素.广播操作是MPP系统中常用的通讯方式,快速地实现广播将有助于提高系统的性能.本文基于TORUS互连网络,提出了实现广播的流水方式,并分析丁它的性能,指出采用流水方式进行广播,可以减少广播延迟,改进系统的性能.  相似文献   

7.
一种新的高性能VPN系统的模型分析   总被引:2,自引:0,他引:2  
首先针对VPN系统性能的瓶颈讨论了当前常规的性能提升的方法.接着在对VPN体系进行剖析的基础上,提出了一种新的基于流水线和多卡并行处理(Pipeline、Multi—cards Parallel)的模型,并分别对流水线模型和多卡并行处理模型进行了分析.为了对PMP模型进行验证,文章给出了改造后的FreeSWAN软件结构,并提供了性能测试数据作为比较.最后对新系统的性能进行了理论分析,推导出了系统性能和加密卡的速度、并行加密卡的个数以及性能损失率之间的数学关系.  相似文献   

8.
一种基于自动机分解的网络协议并行处理策略   总被引:1,自引:0,他引:1  
为了解决线程级并行体系结构带来的线程间对于共享资源的竞争问题,利用模拟对协议处理自动机中不同状态阶段的性能特点和在SMT结构上各状态阶段对于Cache竞争的情况进行了对比,指出CPU中Load/Store部件有可能构成协议处理的性能瓶颈之一,且对于有状态协议的处理在建立连接阶段具有较强的Cache竞争能力.进而提出一种新的协议并行处理策略,根据各状态阶段的性能特点利用有限自动机分解的方法将协议自动机划分成若干子自动机后并行处理.模拟结果表明该策略能够缓解协议并行处理时线程间对于Cache的竞争,在真实SMT环境中与基于连接的并行策略相比处理性能提高了5%左右.  相似文献   

9.
加速比的局限性分析   总被引:1,自引:0,他引:1  
并行处理技术是获得高性能计算机的有效而必由的手段,因而成为新一代的结构特征,在并行处理的性能评价中,被广泛采用的一个性能特征就是加速比。加速比是否能够合理地反映并行处理系统的性能呢?我们在本文中分析了加速比的局限性。  相似文献   

10.
Cache一致性机制是并行处理系统研究中的一项重要课题。对由大量处理机构成的并行处理系统而言,一致性机制应具备良好的可缩放性,能够在不同规模的多处理机系统中都能表现出较高的性能。本文对6种典型实施方案进行了模拟,分析其在并行处理系统中的适用性,并探讨了改进方法  相似文献   

11.
随着并行系统规模的扩大,高性能计算系统运行时消耗的能耗也在急剧增长,过高的能耗也给系统的可靠性、稳定性等方面带来严峻挑战。在这种情形下,能耗问题受到了前所未有的关注。因此,设计和研究高性能计算系统,需要在考虑高计算性能的同时兼顾系统低能耗的要求,这为高性能计算系统的度量模型提出了新的挑战。于是,大规模并行系统逐渐从"高性能"走向"高效能"的衡量标准。基于此,本文采用加速比度量指标,从系统可扩展角度将计算性能和能量消耗要素进行综合,提出了一种度量高性能计算系统综合性能的能耗并行加速比模型。该模型能够直观地反映并行计算系统的效能,旨在指导系统设计和应用研究。最后,通过对该模型的分析和模拟,验证了模型的有效性。  相似文献   

12.
系统度量指标的研究一直是并行系统和应用设计的重要问题。本文首先通过对国内外并行计算系统度量指标的分析,将当前并行计算系统度量指标分为单一的计算性能度量指标和多要素综合的高效能度量指标两种。其次,总结了这些度量指标的研究现状,并指出这些度量指标研究中存在的一些问题以及需要考虑的难点。由于并行计算系统正在逐渐从"高性能"走向"高效能",本文主要考虑当前大规模并行计算系统的可靠性和能耗要素对系统的影响,从系统可扩展角度建立了可靠并行加速比和能耗并行加速比模型,并进一步扩展为度量并行计算系统效能的综合指标模型。最后指出了未来并行计算系统度量的研究方向。  相似文献   

13.
PC机群环境下最短路径并行算法的研究   总被引:11,自引:0,他引:11  
本文在PC机群环境下,研究了最短路径并行算法。在非循环图网络模型和强连通随机网络模型上对算法的加速比和并行效率进行了实验研究,讨论了在PC机群环境中提高并行性能的方法及不同网络规模和网络模型下算法的加速比和效率。  相似文献   

14.
并行问题和最短路径问题已成为一个热点研究课题,传统的最短路径算法已不能满足数据爆炸式增长的处理需求,尤其当网络规模很大时,所需的计算时间和存储空间也大大的增加;MapReduce模型的出现,带来了一种新的解决方法来解决最短路径;GPU具有强大的并行计算能力和存储带宽,与CPU相比具有明显的优势;通过研究MapReduce模型和GPU执行过程的分析,指出单独基于MapReduce模型的最短路径并行方法存在的问题,降低了系统的性能;论文的创新点是结合MapReduce和GPU形成双并行模型,并行预处理数据,针对最短路径中的数据传输和同步开销,增加数据动态处理器;最后实验从并行算法的性能评价指标平均加速比进行比较,结果表明,双重并行环境下的最短路径的计算,提高了加速比。  相似文献   

15.
非结构网格的生成在时间和内存上有一定的缺陷,这里提出了一种新的方法,命名为GPU-PDMG,是基于CUDA架构的GPU并行非结构网格生成技术。该技术结合了GPU的高速并行计算能力与Delaunay三角化的优点,在英伟达GPU模块下采用CUDA程序模型,开发出了加锁并行区划分技术,通过对NACA0012翼型、多段翼型等算例进行测试,分析此方法的加速比和效率,对其计算性能展开评估。实验结果表明,GPU-PDMG优于现存在的CPU算法的速度,在保证网格质量的同时,提高了效率。  相似文献   

16.
SMP机群系统是一种新型的系统结构。由于依赖于处理器的传统加速比模型不再适用于SMP机群系统,文中提出了面向结点的加速比模型,它将传统的串行与并行的对比关系扩展为个体与整体之间的对比关系。通过对基于处理器的传统加速比概念的研究,推导出了基于SMP机群系统的面向结点加速比的计算公式。面向结点加速比模型充分考虑了实际运行时间的可测性,反映出了系统在使用了多个结点之后性能的改变。事实上,传统的加速比模型  相似文献   

17.
分布式并行模拟是提高体系结构模拟速度的有效技术手段之一.首先,建立了分布式并行模拟的通用性能分析模型,并对典型系统的并行加速比、并行效率等性质进行了理论分析,得出了一些有用的结论.在此基础上,提出了均衡可扩展分布式并行模拟方法SEDSim(scalable and evenly distributed simulation).SEDSim 针对模拟节点负载不均衡问题,提出了开销模型指导的指令区间均衡分割和分配策略CoMEPA(cost model guided evenly partitionand allocation);针对分布式并行模拟与非连续、任意数量抽样模拟区间的高效集成,提出了基于最小等价距离(minimum equivalent cost,简称MinEC)的指令区间分配策略MinEC.基于sim-outorder 实现了SEDSim,采用SPECCPU2000 中的部分程序对其速度和精度进行了测试,理论分析和测试结果均表明了SEDSim 的优势:相对于常用的方法或策略,CoMEPA 和MinEC 分别能够获得多达约1.6 倍和1.4 倍的性能提升.  相似文献   

18.
In this paper, the parallel implementation of the iterative alternating direction explicit method by D'Yakonov (IADE-DY) and the Mitchell and Fairweather double sweep method (DS-MF) compared with the alternative direction implicit (ADI) method for solving the 2D telegraphic problem on a distributed system of Armadillo cluster and geranium Cadcam cluster using the parallel virtual machine and message passing interface is presented. We implement the scheduling of n tridiagonal system of equations with the above methods to show improvement on speedup and efficiency with parallel strategies across the two platforms. The single program multiple data model was employed for the implementation. The IADE-DY, DS-MF and ADI are developed by the splitting of the implicit equation using the finite difference discretization on the 2D telegraphic problem. The implementation is discussed in relation to means of the performance parallel strategies and analysis. The model enhances overlap communication and computation to avoid unnecessary synchronization, hence, the method yields significant speedup by the use of the non-blocking communication. We present some analyses that are helpful for speedup and efficiency.  相似文献   

19.
蚁群算法的三种并行模型分析   总被引:1,自引:0,他引:1       下载免费PDF全文
王磊  曹菡  王长缨 《计算机工程》2011,37(12):170-172
在单机多核下分别构造基于OpenMP和MPI的并行蚁群算法模型,在多核集群机下构造基于MPI和MPI+OpenMP的并行蚁群算法模型,并提出动态蚁群择优策略及分段周期交流策略。基于实际路网的路径寻优问题对上述模型进行比较,实验结果表明,在单机多核下,基于MPI的模型与基于OpenMP的模型相比,运行时间短,加速比高,在多核集群机下,基于MPI+OpenMP的混合模型相比基于MPI的模型,在进程数较多时仍具有较高的加速比。  相似文献   

20.
商业CFD程序已广泛应用于反应堆的热工水力模拟,但不能完全满足反应堆的应用需求;开源CFD程序有部分应用,但与商业CFD程序相比,在物理模型全面性、计算精度、计算效率及易用性等方面仍存在差距。为更好地满足局部精细热工水力分析的需求,需要更全面的物理模型、较高的计算精度和较好的并行计算效率,因此有必要开发自主热工CFD程序。详细描述了热工流体力学并行应用程序YH-ACT的设计、实现方案以及测试结果。选取3个典型案例,通过与典型商业软件Fluent计算结果进行对比验证软件正确性, 程序并行计算规模达到400个结点共9 600个进程,稳态计算加速比为111.7,并行效率为27.9%,瞬态计算加速比为37.2,并行效率为9.3%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号