共查询到11条相似文献,搜索用时 46 毫秒
1.
针对应用自动单模变换的两大困难,如何自动 使多重不并行化的恰当的单模变换矩阵以及如何解决防碍模国计算的非常数归约相关距离,提出了如何对给定常数距离矩阵,自动找出使循环并行化的恰当的单模变换矩阵的技术,然后提出将组归约相关表示为最小常数距离向量,从而使存在归约相关的多重量重循环也能够应用自动单模变换技术,为自动单模变换技术走向实用化提供了理论依据。 相似文献
2.
该文介绍了大规模并行处理系统程序自动并行化工具FAX(FortranAutomatedXlator)的系统概况。重点阐述了FAX中所采用的先进技术。测试结果表明,FAX已具备一定的可用性及有效性,作为面向分布主存并行机系统的程序自动并行化工具,基本达到了设计目标。 相似文献
3.
4.
不规则计算在大规模并行应用中广泛存在。在面向分布存储结构的自动并行化过程中,较难在编译时为不规则循环生成并行代码。并行代码中的通信代码对程序运行结果的正确性以及加速效果有着严重的影响。通过分析程序的数组重分布图,使用部分冗余的通信方式来维持不规则数组访问的生产者消费者关系,可以在编译时为一类常见的不规则循环自动生成有效的通信代码。该方法使用计算分解和数组引用的访问表达式求解不规则数组在各处理器的本地定义集作为通信的数据集,分析针对此类不规则循环划分的通信策略,继而生成相应的通信代码。实验测试的结果取得了预期的加速效果,验证了方法的有效性。 相似文献
5.
L为一个顺序执行的DO循环语句,其中包含赋值语句或IF-THEN-ELSE条件语句。通过数据相关性分析,计算相关距离,可以析取L中内在的并行性,实现L向DOALL循环的完全变换或部分变换。本文具体讨论了通过相关距离,对包含具有较为复杂的数组索引下标的赋值语句的DO循环,以及包含静态条件语句的DO循环进行并行化处理的两种方法。 相似文献
6.
7.
8.
MPP Fortran是Cray公司为分布存储、全局编址的Cray T3D MPP系统推出的一种数据并行语言。本文首先介绍了MPP Fortran的主要特点,然后以该语言为例,对面向MPP系统程序自动并行化的基本内容以及关键技术进行了分析和探讨。 相似文献
9.
介绍一种可扩展的自动并行化编译系统Agassiz,研究其架构设计及关键特性。该系统可以把串行程序转换为并行程序,并为编译优化技术的研究提供良好的平台,通过面向对象的设计和实现,能有效集成各种并行优化技术。实验结果表明,该系统具有良好的可扩展性。 相似文献
10.
利用U模变换增加并行粒度与改善数据访问局部性的方法 总被引:3,自引:0,他引:3
提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法,该方法利用了给定二重循环的相关向量集的某些性质,将外层循环变量不同而内层循环变量相等的若干次迭代合并,成为折叠后迭代空间的一个结点,并且保持内层循环的并行性不变,从而达到增加循环并行粒度的目的。对于更普遍的情况,该文讨论了如何根据给定循环的循环向量集,确定一个U模变换对迭代空间进行变换,达到内层循环可并行和扩大循环粒度两个目的,针对循环变换中数据访问局部性可能变差的问题,该文提出了对内层循环先合并,根据合并后的相关向量集变换迭代空间,以及折叠迭代空间的方法,该文的方法是Wavefront循环并行化方法的一种扩展。 相似文献
11.
Iwata 《Algorithmica》2008,36(4):331-341
Abstract. This paper presents a new algorithm for computing the maximum degree δ
k
(A) of a minor of order k in a matrix pencil A(s) . The problem is of practical significance in the field of numerical analysis and systems control.
The algorithm adopts a general framework of ``combinatorial relaxation' due to Murota. It first solves the weighted bipartite
matching problem to obtain an estimate
on δ
k
(A) , and then checks if the estimate is correct, exploiting the optimal dual solution. In case of incorrectness, it modifies
the matrix pencil A(s) to improve the estimate
without changing δ
k
(A) .
The present algorithm performs this matrix modification by an equivalence transformation with constant matrices, whereas
the previous one uses biproper rational function matrices. Thus the present approach saves memory space and reduces the running
time bound by a factor of rank A . 相似文献