首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 749 毫秒

1.  单线程程序到多线程程序的自动转换  
   韩培安  王力生《微计算机应用》,2010年第31卷第12期
   给出了一种将单线程程序自动变为多线程程序的一种方法.该方法基于依赖性分析,将依赖性分析的结果用有向无环图表示出来,然后将有向无环图分解成多个存在依赖关系的集合,同一集合内的元素却不存在依赖关系,它们之间是可以并行执行的,集合间是有执行先后顺序的.然后将各个集合看作各个并行域,并行域内部的程序并行执行,处理并行域的时候,可以用各种模型,如:Thread and Lock,OPENMP等,最后生成相应的并行程序.    

2.  构造串行程序对应的并行任务(DAG)图  
   郭龙  陈闳中  叶青《计算机工程与应用》,2007年第43卷第1期
   目前在并行计算研究领域中很大一部分工作是将串行程序并行化,如何发掘串行程序中存在的并行性,一个好的方法就是构造其对应的并行任务(DAG)图,对并行任务图的分析,调度和最终实现并行计算的工作已经有很多人做过,但是由串行程序构造DAG图的工作相对很少。论文分析了串行程序中存在的依赖关系,并以此为依据,提出了一种由现有的串行程序或者串行解决方案构造对应的并行任务(DAG)图的算法。    

3.  多重循环的软件流水:比较和提高  
   李文龙 汤志忠《计算机科学》,2004年第31卷第3期
   循环并行化是并行编译的核心问题之一。许多科学计算程序的大部分执行时间花费在循环上,有效开发循环中的并行性将提高整个程序的执行效率。多重循环最为常见,因此并行化多重循环具有重要的理论和现实意义。现代处理器中硬件资源迅速增长,也使得在整个多维循环空间中开发并行性成为必要。目前大多数软件流水算法只对最内层循环,仅有少数的算法对多重循环进行软件流水,本文介绍几种多重循环的软件流水算法,比较它们之间的相似与不同之处,为编译器实现中算法的选择提供了指导。    

4.  基于任务图的多处理器负载均衡调度算法  
   芦奉良  刘羽  张军《计算机工程》,2011年第37卷第11期
   针对共享存储多处理机系统中各处理机负载不均衡的问题,提出一种新的任务调度算法——多重波前法。在任务图划分的基础上,采用分层调度方式对原波前法进行改进,通过对任务序列进行多重遍历和重组以降低各处理器的分配误差,利用循环调度算法提高任务调度结果的精度,并给出该算法的并行实现。实验结果证明,该算法具有较低的任务分配误差和较高的系统并行效率。    

5.  全局指令调度综述  
   杨书鑫  张兆庆《计算机工程与应用》,2004年第40卷第21期
   指令调度通过调整指令之间的顺序来提高指令级并行度(ILP)。然而基本块通常很小,因而潜在的ILP也很小。随着芯片设计技术的发展,现代的处理机所包含的资源却越来越丰富。指令调度只有跨越基本块的边界(即全局指令调度)才能够充分发挥处理机潜在的和程序中固有的ILP。全局指令调度可划分为有环和无环两种。该文介绍了无环全局指令调度的几种影响力较大的算法。同时还简单介绍了有关全局指令调度的新的热点。    

6.  循环迭代间不规则并行性高效,完全的开发方法  
   金国华 杨学军《电子学报》,1992年第20卷第8期
   循环占据了FORTRAN程序的大部分运行时间,循环级并行性的有效开发是程序并行化过程中一个最关键环节之一,尽管人们已对循环并行化进行了广泛而深入的研究,然而现有技术对循环的处理并不是那么令人满意。本文提出了一种新的能有效、完全地开发循环迭代间不规则并行性的技术。    

7.  支持有向有环图的微调度方法  被引次数:1
   文严治  连瑞琦  吴承勇  冯晓兵  张兆庆《计算机研究与发展》,2005年第42卷第3期
   指令调度是编译器中的重要优化阶段.如何充分利用处理器结构相关的资源,发掘程序并行性,以提高编译优化性能和增强代码可适应性,一直是指令调度的研究难点之一.目前微调度已经取得了一定的效果,但对软件流水产生的有向有环图则未能提供支持.在ORC中提出并实现了一种基于IA-64体系结构的支持有向有环图的微调度方法,有效地减少了程序执行周期和流水线停顿,取得了较为满意的编译优化性能.    

8.  用于含过程调用DO循环的循环嵌入方法  
   原庆能  丁永华  臧斌宇  朱传琪《软件学报》,1997年第8卷第11期
   循环是程序中蕴含并行性最为丰富的一种结构,因此成为并行化编译最主要的对象.但循环内的过程调用严重妨碍了循环的数据相关性分析,使得循环语句潜在的大量并行性得不到开发.本文提出的循环嵌入方法使部分含过程调用循环语句的并行化成为可能,对部分用其它过程间分析技术也能开发其并行性的这一类循环语句采用循环嵌入方法,并行化开销低,并且分析更精确.采用循环嵌入方法还可降低程序由于多次过程调用带来的调度开销.这一方法在作者开发的自动并行化编译系统AFT(automaticPortrantransformer)中得到了实现,对Spec92测试程序包的试验结果表明了本文提出的方法是行之有效的.    

9.  网格调度的算法研究及改进  
   肜丽  姜明富《黑龙江电子技术》,2014年第6期
   优化网格资源调度算法可以提高网格系统执行效率,给任务安排合理的执行顺序和合适的处理器是优化网格资源调度算法需突破的关键技术.文中研究并实现了(Heterogeneous-Earliest-Finish) HEFT[1]算法和新的(Hierarchical Reliability-Driven Scheduling)HRDS算法.采用DAG[2]任务图生成函数,通过对已有HEFT算法进行研究,采用SimGrid为在分布计算环境下进行分布并行应用调度研究提供一个仿真环境,对HRDS算法进行了改进和验证.验证过程中在HRDS算法中加入了可靠性开销作为调度依据,并把算法分为两层调度,本地可靠性驱动调度和全局可靠性驱动调度.两算法的调度结果在SimGrid网格模拟器中仿真调度,仿真成功并且调度结果在可靠性和性能方面HRDS都比HEFT算法要好.    

10.  基于量子粒子群优化的DAG并行任务调度研究*  
   张聪  沈惠璋《计算机应用研究》,2010年第27卷第7期
   任务调度是网络并行计算系统的核心问题之一。在有向无环图(DAG)描述问题的基础上,提出了一种进行并行任务调度的量子粒子群优化算法。首先对DAG并行任务调度问题作出定义,并给出了优化问题的目标;然后分别讨论了问题的编码表示、解码方案、位置向量的计算方法、离散问题连续化、算法的总体流程等;最后给出算法的仿真实验情况及分析,实验结果表明,该算法有良好的全局寻优性能和快捷的收敛速度,调度效果优于遗传算法和粒子群优化算法。    

11.  基于图模型的多边形自动并行构建算法  被引次数:1
   陈占龙  张丁文  吴亮《计算机应用研究》,2012年第29卷第5期
   目前GIS基础算法并行化成为高性能GIS进一步深入的前提,作为GIS空间分析基础算法的重点,有必要对多边形构建提出一种自动并行算法。为此,提出基于图模型的多边形自动并行构建算法。该算法根据图模型中有向闭合环的特点对一组线段的集合进行多边形构建,能有效提高多边形构建的自动化程度。将搜索、排序等耗时较多的操作进行并行化处理,能有效减少全局搜索次数及整体排序和逻辑操作时间。实验表明,在对大规模线性数据生成区域时,该算法能有效地实现效率提升,达到良好的效果。    

12.  OpenMP多线程负载均衡调度策略研究与实现  被引次数:4
   任小西  唐玲  李仁发《计算机科学》,2010年第37卷第11期
   循环并行化是OpenMP并行化程序中最重要的部分,线程数、循环体大小、调度策略等是并行化过程需要考虑的主要因素。为了在调度开销与负载均衡之间获得更好的权衡,在OMPi编译器中实现了梯式trapezoid调度策略,以提高OpenMP多线程程序的运行性能。实验结果表明,梯式调度策略应用在递减以及某些极不规则的循环结构中,在适当的线程数下,与指数调度相比,该调度策略能表现出更好的性能。    

13.  面向DSWP并行的OpenMP任务调度机制的扩展与实现  
   刘晓娴  赵荣彩  丁锐《计算机科学》,2013年第40卷第9期
   多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序.自动并行化技术是将单线程程序移植到多核上的重要手段,但是当循环中存在无法确定的数据依赖或复杂的控制流时,传统的自动并行化技术无法取得良好效果.Ottoni等人针对传统自动并行失败的循环提出了Decoupled Software Pipelining(DSWP)算法用以实现指令级的细粒度并行,但其需要对处理器体系结构的深入了解以及对核间通信队列和专用指令的硬件支持,并行性能和应用广泛性受到限制.基于OpenMP应用编程接口实现的DSWP并行不依赖于硬件上对核间通信队列和专用指令的支持,且不受平台的限制,但现有的OpenMP任务调度机制无法满足DSWP并行中对任务调度的需求.对现有的OpenMP任务调度机制进行扩展,增加了任务与线程绑定的属性,保证了基于OpenMP的DSWP并行程序的正确执行.在GCC的OpenMP运行库libgomp中扩展了任务绑定属性子句的功能,扩展后的GCC作为OpenMP DSWP程序的基础编译器,为自动并行提供支持.通过对基准测试集NPB3.3.1的测试表明,传统自动并行失败的循环,经OpenMP DSWP自动并行后在双核处理器上平均加速比达到1.23以上;使用添加了OpenMP DSWP算法的Open64编译器生成的并行程序,与仅使用传统自动并行方法的Intel 编译器和Open64编译器所得程序相比,平均加速比分别高出22%和26%.    

14.  并行分布计算中的任务调度问题(二)  被引次数:3
   陈华平 李京《计算机科学》,1997年第24卷第2期
   在并行程序设计中,SPMD是最为常用的一种编程模式,该模式下的任务调度有其自身的一些特点,本文首先讨论了如何用闭式表达式来决定该执行模式下的最佳处理器数。然后,针对任务图存在的不确定性,介绍了采用动态技术进行任务调度的一般方法。由于动态调度会带来额外开销,因此有效的动态调度方案必须结合实际具体的并行程序和硬件系统。为了减少动态调度开销,对于一些含有不确定性的任务图,也可通过任务图归约技术,先把不确定性转换为确定性,然后再利用静态调度方法,本文我们主要讨论了条件分支语句的静态调度问题。另外,并行循环的调度分配是影响并行程序执行性能的一个重要因素,在本文的最后我们结合独立循环、相关循环、均匀循环和非均匀循环的调度分配问题,着重讨论了基于循环分配的自适应混合调度方法,以及变循环传递相关为循环独立相关的循环展开(un-rolling)技术。    

15.  并行性挖掘的图文法方法  
   邹阳  吕建  曾晓勤《小型微型计算机系统》,2011年第32卷第2期
   并行性分析技术一般通过对程序的控制与数据流图或相关依赖图的分析来实现,因而需要从程序中抽取出相应依赖图的算法的支持.本文基于上下文相关图文法RGG形式框架,定义了一种任务级的并行编程图语言GPPL来直接描述顺序或并行程序的控制与数据流图,而且设计了相应的并行性分析算法以挖掘GPPL图程序的并行性特征.GPPL图语言可视为并行程序设计与程序代码生成之间的协同语言,从而使并行性挖掘避免了从程序中抽取出相应依赖图的过程.与已有的描述顺序或并行程序的图语言及其分析算法相比,GPPL图程序形式更为简洁和直观,易于设计,描述能力也更强;基于GPPL图的并行性分析算法的分析能力更强,而且具有可扩展性.    

16.  串行算法并行化处理的数学模型与算法描述  
   吴越《计算机技术与发展》,2012年第5期
   并行计算是指同时使用多种计算资源解决计算问题的过程,节省了大量计算时间,极大地提高计算效率.目前各领域大量的串行程序已经相当成熟,所以如何通过一种转换,将现有大量的串行程序转化成并行程序,是提高程序运行速度的突破口.为了将串行程序并行化,以提高程序的运行效率,充分利用已经非常成熟的大量串行程序,文中从图论出发,建立并讨论了串行算法并行化的三个数学模型:有向带权图模型、集合划分模型、标记AVL树模型.通过这些数学模型,基于图论的思想方法,文中讨论了串行算法并行化的可行性,并提出了串行程序并行化的算法思想    

17.  ORC的全局指令调度技术  
   杨书鑫  张兆庆《计算机学报》,2004年第27卷第5期
   IA-64是一种崭新的体系结构.它为挖掘程序中潜在的指令级并行提供了丰富的硬件支持,例如:大寄存器组、(控制/数据)投机、谓词等.Itanium是IA-64的一个具体实现.该文作者将Bernstein的基于超标量处理机的全局指令调度算法应用于显式并行(EPIC)的Itanium处理机上.在结合Itanium处理机特性的同时,作者对Bernstein的算法有以下两点创新:(1)应用层次化区域.相对于传统的扁平区域,这样的区域具有很强的灵活性并提供了调度器大小合适的调度范围,使其既能充分利用硬件资源又能够有效地控制调度的时间和空间开销.(2)集成P—Readyr指令调度.P—Ready是在与Bernstein算法框架差异很大的上下文中提出的.P—Ready指令调度能够把优先级高的指令尽早调度即使这条指令并没有在所有经过它的执行路径上解除数据依赖.集成P—Readyr指令调度到Betnstein的算法框架上是十分有意义的.作者在“基于Itanium处理机的开放源码编译器ORC”中实现了该文介绍的算法,实验结果显示全局指令调度器对CPU2000int基准测试例平均有8.4%的运行时加速比.作为应用层次化区域的优越性的一个反映,调度指令跨越嵌套循环最高可取得12.9%的运行时加速比.此外,P—Ready指令调度对CPU2000int的测试例平均有1.37%的运行时加速比,最高可达7.6%.    

18.  串行程序的任务DAG图构造算法  
   孙立斌  邓蓉  陈闳中《计算机系统应用》,2012年第21卷第9期
   任务DAG图是刻画程序中各任务间依赖关系的一种手段,DAG图上除了标有任务间的依赖关系,还记录了各任务的计算量和任务之间的通信量,这些信息共同构成了任务调度的依据,国内外有许多基于任务DAG图的调度算法研究,但通过分析串行程序的相关性来构造任务DAG图的研究却不多见.分析了串行程序中存在的数据相关性和控制相关性,就程序中的顺序,分支,循环三种基本结构进行分别讨论,提出了一种串行程序任务DAG图的构造算法.    

19.  一种精确的调用图生成技术  
   唐新春 郭春榕《计算机工程与设计》,1997年第18卷第5期
   调用图是过程间分析和程度自动并行化的基础。生成精确调用图可以进一步开发程序的并行性。此文针对Fortran程序,提出了一项完全消除哑过程,产生精确调用图的技术与相应的算法。该算法已在面向MPP Fortran的程序自动并行化工具中实现。    

20.  CFD程序自相关循环的并行化方法研究  
   傅游  花嵘  丁晓宁  康继昌《微电子学与计算机》,2003年第20卷第4期
   针对CFD程序中常见的自相关循环结构,文章分析了波前并行技术不能对其进行并行化的原因,针对其相关实质,提出了自相关循环的镜像分解技术,通过消除跨迭代的反相关,实现自相关循环结构的波前并行,完成自相关循环的并行化。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号