排序方式: 共有5条查询结果,搜索用时 31 毫秒
1
1.
自动向量化编译是利用处理器的多媒体扩展指令集提升多媒体程序性能的理想工具.但目前的研究不能有效加速实际程序.其主要原因是:普通算术操作的向量化不一定有性能提升;而多媒体典型操作因为其在源代码中表现形式多样而不能充分向量化.为了解决这一问题,文章对经典向量化算法进行改进以灵活统一地向量化这两类操作.主要的改进是增加了两个步骤:统一操作的不同表现形式和识别有价值的向量化操作.改进后的算法可以充分利用指令集生成高效代码,从而对实际多媒体程序拥有良好效果.此外,该算法可扩展性也很强. 相似文献
2.
3.
目前人们通常单纯用增加临时变量和相关判断的方法,或者使用共享代码拷贝的方法来消除goto语句,但前一种方法会造成判定增加,语义分析困难,而后一种虽然使转变后的程序结构清晰,却造成了benchmark中的某些程序急剧膨胀,针对上述问题,本文提出了能控制膨胀的代码拷贝算法,且该算法还能有效地处理不可规约的程序。 相似文献
4.
周期常量是指循环中值呈周期性出现的递归标量,它的存在不仅带来循环内与跨循环数据相关,更导致一些不必要的控制相关,该文介绍了周期常量的概念及递归标量转化为差分方程的过程,并应用代数的相关知识提出并证明了周期常量存在的一个充分必要条件,由此给出了检测与传播周期常量的一个有效算法.该算法应用于ADPCM编/解码器,得到了平均超过10%的加速比。 相似文献
5.
基于位宽控制提高SIMD架构并行度的优化算法 总被引:1,自引:0,他引:1
随着SIMD功能单元作为多媒体加速部件的广泛应用,如何有效利用这一构架优化应用程序成为编译优化研究的热点.目前典型的SIMD结构为同一操作对不同的数据化宽提供了不同的指令版本,随着操作数位宽的增加,对应的SIMD指令可同时完成的操作个数也随之降低.因此,如何有效识别操作数的有效位宽,对提高优化过程中SIMD指令内操作的并行度将产生至关重要的影响.文中针对SIMD优化面临的并行度问题,提出了一种优化算法,该算法在对操作数的有效位进行分析的基础上,进行溢出控制,从而减少操作数对宽位宽数据类型的依赖.实验数据表明,该算法可以有效提高多媒体程序优化的并行度,对多媒体程序获得较好的加速效果. 相似文献
1