排序方式: 共有56条查询结果,搜索用时 15 毫秒
21.
过程繁衍及其实现方法 总被引:3,自引:2,他引:1
过程的处理在并行化编译工具中是十分关键的问题,过程嵌入和跨过程信息传播是常用的解决方法.近年来,兼有前二者优点的新技术:过程繁衍(Cloning),逐渐受到人们的重视.而以往的研究中,过程繁衍仅局限于常数值的传播.本文提出了在过程繁衍中进行符号等式约束信息传播的方法,该方法可以增强系统中全局的符号分析(SymbolicAnalysis)能力,并可与一些新技术(如Omega测试)互相配合,从而提高并行化系统的能力.该方法在作者开发的并行化编译工具AFT中得到了实现.对于PerfectBenchmark的测试 相似文献
22.
多媒体程序中消除控制相关的技术研究 总被引:1,自引:0,他引:1
随着多媒体应用的快速发展,最大程度地提升多媒体程序的性能逐渐变为计算机领域研究的热点。硬件平台和多媒体程序的特点是该领域研究需要关注的两个主要方面,当前的主流桌面处理器在提升主频的同时也增大了分支预测失误的开销,而多媒体应用程序中分支语句的大量使用进一步增大了分支预测失误的概率。我们在优化多媒体程序测试试包BMW(Berkeley Multimedia Workload)过程中发现,通过消除程序中的控制相关,尽量减少程序中的分支指令可以显著地提升程序的性能。本文首先讨论了多媒体程序中消除控制相关的一些基本优化方法。针对当前主流处理器引入多媒体扩展指令集来优化程序的趋势,本文进一步总结了在SIMD架构下使用多媒体扩展指令集消除控制相关的 方法。这两方面的优化方法应用到实际程序中,得到的平均性能提升分别为7%和26%。 相似文献
23.
利用U模变换增加并行粒度与改善数据访问局部性的方法 总被引:3,自引:0,他引:3
提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法,该方法利用了给定二重循环的相关向量集的某些性质,将外层循环变量不同而内层循环变量相等的若干次迭代合并,成为折叠后迭代空间的一个结点,并且保持内层循环的并行性不变,从而达到增加循环并行粒度的目的。对于更普遍的情况,该文讨论了如何根据给定循环的循环向量集,确定一个U模变换对迭代空间进行变换,达到内层循环可并行和扩大循环粒度两个目的,针对循环变换中数据访问局部性可能变差的问题,该文提出了对内层循环先合并,根据合并后的相关向量集变换迭代空间,以及折叠迭代空间的方法,该文的方法是Wavefront循环并行化方法的一种扩展。 相似文献
24.
25.
26.
数据划分是在当前主流高性能计算平台上高效并行化应用程序的关键技术,它包括数据分割和处理机分配两个主要部分.Line-Sweep计算模式被众多科学工程计算核心采用,目前该计算模式的并行化主要采用多重数据划分.多重数据划分能保证各处理机的计算量、访存量和通讯量相等,但在某些情况下也会导致访存量和通讯量过多,因此无法保证性能最优.为解决这一缺陷,文中提出均衡数据划分,进一步放松对数据分割和处理器分配的非本质约束,以利于在计算、访存和通讯这3种开销之间达到最佳平衡.文中给出生成最佳均衡数据划分的算法,它包含3个关键技术:首先建立性能模型,在该模型中均衡数据划分的性能只与数据分割方式有关;接着基于该模型缩减数据分割方式的搜索空间,并以该模型为判据搜索性能最佳的数据分割方式;最后设计处理机分配函数以满足均衡数据划分的条件.均衡数据划分被应用于NPB并行测试包中的SP程序和高分子材料计算程序LineABC.实验结果表明,当均衡数据划分与多重数据划分的数据分割方式相同时,二者性能基本一致;当两种数据分割方式不同时(对于SP和LineABC,这种情况所占比例分别高达38.7%和37.9%),采用均衡数据划分的SP程序和LineABC程序的并行效率比多重数据划分平均分别高出44.45%和22.15%. 相似文献
27.
28.
29.
30.