首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
1 引言近年高性能并行计算研究领域已转到异构计算,因为一个复杂的计算问题,如Grand challenge问题,往往存在多种计算需求,任何单一的计算模式,如:SISD,SIMD,MIMD,数据流等,都不能使求解过程顺利进行。只有按需分配计算模式,才能取得计算性能最优。异构计算的关键是并行性特征的提取。我们已经提出了基于程序结构和基于程序运行性能分析的两种方法,但还不完善。本文希望通过数组元素视图作深入的研究。  相似文献   

2.
傅立国  姚远  丁锐 《计算机应用》2014,34(4):1014-1018
不规则计算在大规模并行应用中广泛存在。在面向分布存储结构的自动并行化过程中,较难在编译时为不规则循环生成并行代码。并行代码中的通信代码对程序运行结果的正确性以及加速效果有着严重的影响。通过分析程序的数组重分布图,使用部分冗余的通信方式来维持不规则数组访问的生产者消费者关系,可以在编译时为一类常见的不规则循环自动生成有效的通信代码。该方法使用计算分解和数组引用的访问表达式求解不规则数组在各处理器的本地定义集作为通信的数据集,分析针对此类不规则循环划分的通信策略,继而生成相应的通信代码。实验测试的结果取得了预期的加速效果,验证了方法的有效性。  相似文献   

3.
本文面向计算流体力学(CFD)提出了数据自动迁移的并行计算模型(ADM模型),符合该模型的并行CFD程序能够根据计算节点的计算能力及负载轻重,自动将数据迁移至计算能力强,负载轻的计算节点,从而使得并行程序能够在网络计算平台上取得较好的并行效率,本文还讨论了自动并行化系统对ADM模型的支持方法,最后给出了性能测试结果。  相似文献   

4.
程序自动并行化中的数组终写关系分析   总被引:1,自引:0,他引:1  
罗勇  张平  龚雪容 《计算机工程》2008,34(16):95-97
在程序自动并行化中过程中,数据收集阶段可能产生冗余通信,该文利用数组终写关系分析的方法来消除冗余通信,实现嵌套循环中数组数据最后写关系的快速求解,并将结果提供给编译器后端,生成精确数据收集代码。描述数组终写关系的研究目的和内容,将所处理的嵌套循环根据其结构特征进行分类,给出实现算法的过程。测试结果证明了该算法的正确性和高效性,所产生的精确数据收集代码能够有效地消除部分冗余通信,从而优化和提高了并行化程序的性能。  相似文献   

5.
针对并行处理的热点问题,本文分析了面向CFD的程序自动并行化工具APFC。APFC实现了数组共享变量的识别和相关性分析,能够自动搜索贴内同步和通信点,并自动生成并行划分后的节点源程序。经APFC处理的程序有很好的可移植性和较高的并行效率。  相似文献   

6.
针对并行处理的热点问题,本文介绍了面向CFD的程序自动并行化工具APFC。APFC实现了数组共享变量的识别和相关性分析,能够自动搜索帧内同步和通信点,并自动生成并行划分后的节点源程序。经APFC处理的程序有很好的可移植性和较高的并行效率。  相似文献   

7.
程序自动并行化系统   总被引:23,自引:10,他引:23       下载免费PDF全文
朱传琪  臧斌宇  陈彤 《软件学报》1996,7(3):180-186
有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术.测试结果表明AFT系统在功能上已超越了传统的自动并行化系统.  相似文献   

8.
有效的数组私有化方法:相关-覆盖方法   总被引:5,自引:0,他引:5  
数组私有化是并行化编译中的重要技术,该方针对现有数级私有化方法的不足,分析了数组私有化的本质,提出了一个数组私有方法:相关-覆盖方法。它将相关性分析技术和数据覆盖技术有机地结合在一起,具有了执行效率高、处理能力强、独立于数据表示的特点。  相似文献   

9.
为使Petri网系统能够并行执行或模拟运行,提出了基于P-不变量的Petri网并行化方法.根据Petri网系统具有同步与并发的特点,给出基于P-不变量的Petri网模型分割、进程创建条件与并行化分析.在此基础上,提出并行进程创建条件拓展定理并给予证明和实例验证.给出实现并行化所需要解决的Petri网模型行为规范的形式化、P-不变量求解与基于P-不变量的Petri网并行化方法.实验结果表明,基于P-不变量的Petri网系统的并行化方法是可行和有效的.  相似文献   

10.
我们知道,地震数据处理工作模块的工作是按如下步骤进行的。它们必须在地震数据作业子操作系统的控制下运行。一个处理过程往往要处理数以千记的记录道;另一方面,同一道记录又要用很多个工作模块做处理。这些工作模块构成一个作业。在同一个作业中有些工作模块的处理顺序是不能变动的。而有些则是可以变化的。工作模块一般由分析功能和执行功能组成。分析功能系指对于地震作业卡进行译码、分析,从而确定本模块的工作方式。在一个作业卡中,不管这个工作模块要做多少处理,而分析功能却只进行一次。执行功能系指工作方式确定之后对地震记…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号