首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
丁锐  赵荣彩  韩林 《计算机科学》2012,39(3):290-294
计算和数据自动划分是并行化编译中一种自动分配计算和数据到各个处理机的优化技术,划分的结果直接影响程序并行的性能。数组是划分处理的主要对象之一,一些数组分布后的收益不高,但带来的并行约束却能对其它数组的划分产生干扰,导致大量数据重分布通信的产生。现有的划分算法中没有约定数组分布的优先次序,因此无法限制这些数组并行约束的传播,降低了优化编译器后端自动生成并行代码的性能。提出了一种基于主导值的计算和数据自动划分算法:将划分过程中数组对程序并行性的影响量化为主导值,并依据主导值的大小约定数组分布的优先次序,限制干扰数组并行约束的传播速度,提高划分结果的合理性。实验结果表明,算法能够获得良好的划分效果。  相似文献   

2.
LS SIMD C编译器的数据通信优化算法   总被引:1,自引:1,他引:0  
1 引言当前理想的程序自动并行化系统的实现存在许多难于解决的问题,因此较为流行的并行计算方法是利用并行语言编写并行程序,编译器对并行程序进行编译生成相应的节点程序执行。并行语言按并行执行的粒度分为基于任务的并行语言(主要面向一般应用领域的计算)和数据并行语言(主要应用于科学数值计算),典型的数据并行语言如HPF。对于数据并行语言而言,程序执行的并行性已由程序设计人员根据程序中的数据相关性给出。因此,如何确定数据的分布、优化数据的通信是影响并行程序执行效率的重要问题。数据分布大致可以分为两个阶段:首先对源程序中数据的相关性分析得到数据在抽象处理机上的分布,然后将抽象处理机上的数据分布映射到物理处理机上。数据分布的确定通常有以下几种实现方式:一种是由程序员给出抽象数据分布,编译  相似文献   

3.
数据划分是在当前主流高性能计算平台上高效并行化应用程序的关键技术,它包括数据分割和处理机分配两个主要部分.Line-Sweep计算模式被众多科学工程计算核心采用,目前该计算模式的并行化主要采用多重数据划分.多重数据划分能保证各处理机的计算量、访存量和通讯量相等,但在某些情况下也会导致访存量和通讯量过多,因此无法保证性能最优.为解决这一缺陷,文中提出均衡数据划分,进一步放松对数据分割和处理器分配的非本质约束,以利于在计算、访存和通讯这3种开销之间达到最佳平衡.文中给出生成最佳均衡数据划分的算法,它包含3个关键技术:首先建立性能模型,在该模型中均衡数据划分的性能只与数据分割方式有关;接着基于该模型缩减数据分割方式的搜索空间,并以该模型为判据搜索性能最佳的数据分割方式;最后设计处理机分配函数以满足均衡数据划分的条件.均衡数据划分被应用于NPB并行测试包中的SP程序和高分子材料计算程序LineABC.实验结果表明,当均衡数据划分与多重数据划分的数据分割方式相同时,二者性能基本一致;当两种数据分割方式不同时(对于SP和LineABC,这种情况所占比例分别高达38.7%和37.9%),采用均衡数据划分的SP程序和LineABC程序的并行效率比多重数据划分平均分别高出44.45%和22.15%.  相似文献   

4.
姿态运动的并行仿真模型   总被引:1,自引:0,他引:1       下载免费PDF全文
本文构造运载火箭姿态运动的并行数字仿真模型。首先将姿态运动的隐式数学模型变换到显式模型,然后应用预处理数值积分方法离散化,并将其计算量均匀地分配给各个处理机,最后构造了各个处理机之间的同步方法。实际计算表明,本文构造的并行仿真模型的计算复杂性小,具有较高的加速比。  相似文献   

5.
陈军  莫则尧 《计算机学报》2007,30(9):1559-1566
在实现多物理并行数值耦合模拟中,需要处理多个物理过程之间网格、并行区域分解的差异.针对该同题,该文基于三维流体力学与激光传播耦合的并行数值模拟,提出了一种实用的并行耦合方法:引入辅助状态将本地插值与通信相分离;构建并行耦合图并定义主导属性,以确定过程间传输的最小数据集合;提供并行数据重分配算法来完成通信.并行数值结果表明:该方法是有效的,在64台处理机上使整体程序获得50.07的加速比.  相似文献   

6.
基于机群系统的数据存储分布是并行数据库领域的一个重要问题。已有的研究工作多集中在基于单个关系的存储分布,不能有效支持复杂多连接查询处理。文章提出了多个关系整体分布方法,给出分布属性选择和处理机分配算法。实验结果表明,算法具有良好的性能,有助于提高并行多连接查询效率。  相似文献   

7.
刘建安  黄可龙 《计算机科学》2002,29(Z1):109-111
一、引言 神经网络是一种常在并行多机系统上运行的程序,它以大规模并行处理为主,神经元之间都是并行操作的.在神经计算的具体过程中,往往会经常出现某些处理机负载过重而其它的处理机负载过轻甚至空闲的情况,大大降低了系统的并行计算效率,延迟了应用问题的执行时间.根据方便、高效、公平的原则,负载均衡的目标就是将重载处理机上的部分负载移动到空闲或轻载处理机上,力求达到最好的计算性能,满足用户的性能期望.  相似文献   

8.
划分点定位并行排序算法   总被引:5,自引:0,他引:5  
提出并分析了划分点定位并行排序(parallel sorting by divide-point locating)算法。在算法中,输入数据被平均划分并分配给所有处理机,因此每个处理机具有相同的工作负载。给出了网络分布计算环境下PSDL算法的实验结果,并与PSRS算法进行了对比。理论分析和实验结果表明,PSDL算法是一种高效率、高扩展性的并行排序算法。  相似文献   

9.
C*语言是通过对ANSIC语言进行进行语法和语义的扩展得的支持SIMD模式的数据并行语言。它允许用户基于一个SIMD虚机描述数据在各个虚处理机上的分布以及对这些数据的并行计算操作,提供了一处简单,有效并与任何特定的机器无关的数据并行编程模型。介绍了C*语言在超级计算机领域中的应用和C*并行扩成分,并给出了典型的编程实例。  相似文献   

10.
C*语言是通过对ANSIC语言进行语法和语义的扩展得到的支持SIMD模式的数据并行语言。它允许用户基于一个SIMD虚拟机描述数据在各个虚处理机上的分布以及对这些数据的并行计算操作,提供了一种简单,有效并与任何特定的机器无关的数据并行编程模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号