排序方式: 共有50条查询结果,搜索用时 15 毫秒
1.
超级并行计算机系统的处理机自调度是当前并行计算机领域的主要研究课题之一。目前CRAY、DEC等公司所采用的指导式GSS方法是比较有效的处理机自调度方法之一,本文将在GSS方法的基础上,进一步提出改进型指导式自调度方法,它集静态调度和动态调度两种方法的优点为一体,是一种实用有效的处理机自调度方法,适合目前大多数并行计算机情况。 相似文献
2.
随着嵌入式系统复杂性的提高,嵌入式系统软件代码的压缩变得非常重要。目前已经有几种代码压缩方法,它们将程序编译后的目标代码中多次出现的代码加以合并,有效地缩短了程序代码的长度。其中,尤以纯软件方法应用最为方便,但该方法不适用于数据堆栈和子程序调 用堆栈合一的嵌入式系统。本文将这种纯软件方法推广到单一堆栈的体系结构,有效地解决了堆栈结构改变对公用块代码语义的影响问题。 相似文献
3.
4.
5.
数据划分是分布主存系统中并行编译的关键技术,它以教组和包含这些教组的嵌套循环为研究对象,以提高教据局部性和挖掘计算并行性为根本目的。对满足给定模式的动态分布的教组向量,通过选取代表元,给出数据划分模式。将单个嵌套循环内的数据划分技术和过程间投影技术很好地结合,解决了动态分布教组的数据划分问题。这种模式弥补了现有数据划分研究的不足。 相似文献
6.
自动向量化编译是利用处理器的多媒体扩展指令集提升多媒体程序性能的理想工具.但目前的研究不能有效加速实际程序.其主要原因是:普通算术操作的向量化不一定有性能提升;而多媒体典型操作因为其在源代码中表现形式多样而不能充分向量化.为了解决这一问题,文章对经典向量化算法进行改进以灵活统一地向量化这两类操作.主要的改进是增加了两个步骤:统一操作的不同表现形式和识别有价值的向量化操作.改进后的算法可以充分利用指令集生成高效代码,从而对实际多媒体程序拥有良好效果.此外,该算法可扩展性也很强. 相似文献
7.
循环是程序中蕴含并行性最为丰富的一种结构,因此成为并行化编译最主要的对象.但循环内的过程调用严重妨碍了循环的数据相关性分析,使得循环语句潜在的大量并行性得不到开发.本文提出的循环嵌入方法使部分含过程调用循环语句的并行化成为可能,对部分用其它过程间分析技术也能开发其并行性的这一类循环语句采用循环嵌入方法,并行化开销低,并且分析更精确.采用循环嵌入方法还可降低程序由于多次过程调用带来的调度开销.这一方法在作者开发的自动并行化编译系统AFT(automaticPortrantransformer)中得到了实现,对Spec92测试程序包的试验结果表明了本文提出的方法是行之有效的. 相似文献
8.
9.
基于指针数组的数据划分模式 总被引:1,自引:0,他引:1
数据划分是分布主存系统中并行编译的关键技术,它以数组和包含这些数组的嵌套循环为研究对象,以提高数据局部性和挖掘计算并行性为根本目的。传统数据划分模式不适合指向数组的指针数组的数据划分,论文提出了解决该类指针数组数据划分的划分模式,文中称为数组向量的数据划分。分析其数据引用的特性,通过选取代表元,给出数据划分的策略,弥补了现有数据划分研究的不足。 相似文献
10.
分析了目前主流采样模拟技术中定长样本的不足,提出了一种基于编译器元数据的采样模拟技术(BigLoopSP).首先利用编译器收集各种可能的周期行为的边界信息作为元数据.然后为了处理程序中大量存在的动态行为,基于编译器产生的元数据结合程序的动态行为进行周期行为的划分和采样点的选取.以此方案划分的变长候选样本能够在保证样本质量的前提下有效地减少所需特征样本的总数.因此比较于定长采样技术SimPoint,BigLoopSP在提高精确性的同时,进一步降低了模拟所需的时间(相对于SimPoint的平均加速比为2.63). 相似文献