首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
高性能微处理器中普遍采用SIMD向量扩展作为计算加速部件。在深入研究SIMD扩展部件数据依赖关系约束条件的基础上,提出一种基于依赖关系逆向图的Tarjan扩展算法,提高了SIMD并行性识别率,并结合传统向量化方法,实现了面向SIMD扩展部件的循环优化技术,消除了不可向量化语句对可向量化语句在数据重组中不必要的开销。实际程序测试结果显示,其在基于依赖关系的SIMD并行性判定方面优于ICC编译器,经过循环优化后,最终生成的SIMD代码其执行效率平均提高了12%。  相似文献   

2.
本文给出一种并行体系结构的优化技术及其在一专有模拟代码上的应用。大多数Unix系统上的软件处工具都在这些技术中得到了综合利用。本文论述用以确定为并行性就得最大好处应于何分割应用程序的方法以及以确定应用程序的哪一部分已被并行化的方法,另外还提供了一种算法,该算法可用来预测增添附加处理机对计算时间的影响。  相似文献   

3.
并行化编译中的一种集成优化方法   总被引:1,自引:0,他引:1  
孙彤  李三立  李晓明 《软件学报》1996,7(12):705-713
本文提出了一种面向分布存储器多机系统的并行化编译方法.针对分布存储并行系统的特点,作者采用的基本优化策略是:折衷并行性与数据引用局部性;减少和隐藏通信开销.通过对基于仿射函数的程序分解方式所导致的数据通信性质的分析,得到了适合分布存储结构特殊要求的并行性开发方法.为了在保持并行性的前提下最小化通信数据总量,提出了基于齐次线性方程组求解的程序全局优化分解方法.为了优化数据通信的组织,提高结点代码的效率,又提出了一种以线性不等式组作为工具的更加实用的通信优化和结点代码生成方法.  相似文献   

4.
从产品研发的角度,针对小资源系统中使用μC/OS-II的实时性和优先级关系进行了分析,提出了可删除任务的灵活应用和可变大小任务栈的实现方法,对于并行任务使用共享资源的几种情况给出了实用解决方案。这些措施获得了良好的任务并行性和实时响应,节约了代码存储空间。  相似文献   

5.
从产品研发的角度,针对小资源系统中使用μC/OS-Ⅱ的实时性和优先级关系进行了分析,提出了可删除任务的灵活应用和可变大小任务栈的实现方法,对于并行任务使用共享资源的几种情况给出了实用解决方案.这些措施获得了良好的任务并行性和实时响应,节约了代码存储空间.  相似文献   

6.
软件流水是一种循环程序的优化技术,它可以有效地提高指令级并行性。由于处理机的实现方法各不相同,在一种处理机上经过软件流水优化后的循环代码很难在其它处理机中移植和使用。反软件流水是软件流水的逆向操作,它可以消除循环代码中的软件流水特性,以便于代码在不同平台上的移植。基于IA-64体系结构,分析了软件流水的代码特点,提出了反流水算法,用于将ICC编译器编译后的可执行二进制代码消除软件流水特性,转换成语义等价的C代码。  相似文献   

7.
在编译优化中,多面体模型可以对计算密集型程序中的耗时较多的循环代码进行并行性和数据局部性优化.但是,多面体建模过程中存在诸多限制,程序中只有少量代码可以被识别进而转换为多面体表示进行优化.基于LLVM编译框架提出一种分析方法,对多面体建模中的非规则因素进行了规范化处理,对非仿射因素提出一种定值扩展方法,消除了多面体建模...  相似文献   

8.
投机优化技术作为一种先进的现代编译技术,有效地提高了指令执行的并行性。然而,在逆向工程中,有时要实现代码的跨平台移植,而投机优化技术又受硬件平台的制约;有时需要优化代码的结构,使程序的逻辑结构易于理解;这些都要求消除这种与硬件息息相关的优化技术。论文基于IA-64平台,提出了一种反投机处理算法,对ICC编译器编译后的可执行二进制代码进行处理,消除代码中的投机优化,将其转换成等价的没有投机优化的指令序列,这样使反投机后的代码更容易理解,而且在逆向工程中摆脱了硬件的限制。测试表明该反投机技术可以对ICC编译后的代码进行有效处理。  相似文献   

9.
一种软件流水的反流水算法   总被引:1,自引:0,他引:1       下载免费PDF全文
软件流水是一种循环程序的优化技术,已经广泛应用于现代优化编译器中.为了充分利用VLIW DSP处理机的指令级并行性,必须使用软件流水技术对DSP程序进行优化.然而,在串行源代码不存在的情况下,对软件流水后的原始代码进行变换、理解、测试和调试,并转换成其他处理机的代码是非常困难的.提出了一种反流水技术,它能够将软件流水后的优化汇编代码反向转换成语义等价的相应代码.通过20个程序的初步实验,验证了所提出的反流水算法的正确性.  相似文献   

10.
田祖伟  孙光 《计算机科学》2010,37(5):130-133
程序中大量分支指令的存在,严重制约了体系结构和编译器开发并行性的能力。有效发掘指令级并行性的一个主要挑战是要克服分支指令带来的限制。利用谓词执行可有效地删除分支,将分支指令转换为谓词代码,从而扩大了指令调度的范围并且删除了分支误测带来的性能损失。阐述了基于谓词代码的指令调度、软件流水、寄存器分配、指令归并等编译优化技术。设计并实现了一个基于谓词代码的指令调度算法。实验表明,对谓词代码进行编译优化,能有效提高指令并行度,缩短代码执行时间,提高程序性能。  相似文献   

11.
用并行遗传算法解决带约束并行多机调度问题   总被引:2,自引:0,他引:2  
吴昊  程锦松 《微机发展》2001,11(1):19-22
遗传算法是一种全局优化的数值计算方法,它存在自然并行性,本文提出了一种解带约束并行多机调度问题的主从式控制网络并行遗传算法,并在PVM环境下实现。计算结果表明,并行遗传算法是有效的,且能适用于大规模并行多机调度问题。  相似文献   

12.
IA-64体系结构支持判断执行,提高指令级并行性,但是编译器为了充分利用该特性而做的优化将程序代码进行深度重构,对逆向工程来说很难从优化后的可执行代码中恢复原程序逻辑。该文提出了消除谓词的反优化技术,提高了可执行代码逆向工程的质量。  相似文献   

13.
支持有向有环图的微调度方法   总被引:1,自引:0,他引:1  
指令调度是编译器中的重要优化阶段.如何充分利用处理器结构相关的资源,发掘程序并行性,以提高编译优化性能和增强代码可适应性,一直是指令调度的研究难点之一.目前微调度已经取得了一定的效果,但对软件流水产生的有向有环图则未能提供支持.在ORC中提出并实现了一种基于IA-64体系结构的支持有向有环图的微调度方法,有效地减少了程序执行周期和流水线停顿,取得了较为满意的编译优化性能.  相似文献   

14.
遗传算法是一种全局优化的数值计算方法。它存在自然并行性。本文提出一种解带约束并行多机调度问题的主从式控制网络并行遗传算法,并在PVM环境下实现。计算结果表明,并行遗传算法是有效的,且能适用于大规模并行多机调度问题。  相似文献   

15.
传统的组合优化蚁群算法在求解优化过程中要消耗大量的时间,极易陷入局部最优解和收敛速度过慢等弊端,同时还会产生大量无用的冗余迭代码,运算效率低;因此,提出一种遗传蚁群优化算法;该算法具备了遗传算法快速搜索全局能力的同时也具备了蚁群算法并行性和正反馈机制;利用遗传算法改变选择算子、交叉算子和变异算子操作来确定路径上信息素的分布,将蚁群算法用于特征选择,采用支持向量机分类器分类性能反馈用于评价特征子集解,并通过对改变信息素的迭代、参数选择和增加对信息素局部更新方式指导特征结点重新组合;仿真实验表明,该算法可以有效提高计算精度,加快收敛速度,优化全局最优解的同时增强了系统的鲁棒性和稳定性。  相似文献   

16.
赵博  赵荣彩  徐金龙  高伟 《计算机科学》2015,42(1):50-53,58
为了充分发挥高性能计算机的计算能力,缓解程序员设计和编写并行程序的压力,扩充可用软件集合,设计并实现了利用交互界面深入挖掘程序中的可向量化语句,优化生成代码中的向量化语句,提高生成代码的执行效率.该方法对充分发挥高性能计算机的计算能力,增强系统可用性和扩展应用范围具有重要的意义,同时能够提供有效的辅助手段和工具支持.渐进式智能回溯向量化代码调优架构通过对用户提交的串行程序进行程序分析和变换,采用串行程序分析、数据依赖分析、向量化分析等技术手段,根据分析结果对程序进行变换和优化,自动生成最终的向量化代码.该方法通过分析串行程序中潜在的并行性,将其自动变换为等价的向量化代码形式,大大简化了程序员的工作.  相似文献   

17.
张科  沈欣 《微计算机应用》2007,28(9):957-960
现今的图形处理器(GPU)除可用来绘制三维图形外,由于其强大的并行处理能力S,还可用来完成复杂的科学计算任务,本文根据Julia分形集的特点,讨论了基于GPU实现Julia分形集的高速绘制的方法,然后对绘制算法进行了优化,并给出了基于GLSL语言编写的核心代码,实验表明,该方法明显提高了Julia集绘制速度,提高了计算并行性,基本满足了实时性的要求。  相似文献   

18.
逻辑推理机的研制是第五代计算机发展的主要方向之一.其目标是设计高性能的并行逻辑推理机.本文介绍了这一崭新的非冯·诺依曼型计算机系统的主要特点.以PSI机为例讨论了串行推理机的结构,并对逻辑推理机中固有的"与"并行性、"或"并行性、"合一"并行性、"流"并行性及搜索并行性进行了分析,通过DADO PROLOG机器、Conery-Kibler PROLOG并行解释程序、并发PROLOG和PARLOG语言的典型实例分析了如何从逻辑程序设计语言、逻辑推理机体系结构及机器硬件实现三个层次来开发上述并行性.  相似文献   

19.
为了提高基于FPGA平台的SoC设计方案的开发速度和运行性能,提出一种基于高层次代码转换的高级综合优化方法.首先将高级语言算法进行软硬件划分,确定在硬件上执行的部分;然后针对在硬件上执行的算法部分,通过代码转换去除函数间数据依赖性、提高循环体并行性,并对循环体进行流水线化;最后将优化方法应用到Alpha-beta搜索算法,完成Blokus-Duo设计.实验结果表明,该方法将高级语言描述自动转化为适于高级综合工具优化的代码模式,提高高级综合生成电路的性能,优化后高级综合生成电路的速度比优化前提高了14倍.  相似文献   

20.
拓扑结构感知的片上网络体系结构应用映射与优化   总被引:1,自引:0,他引:1  
应用映射是片上网络体系结构研究的关键问题之一,映射结果的好坏会极大地影响体系结构的性能。现有的应用映射方法大多基于特定的网络结构,如2d-mesh、2d-torus等,研究NoC性能或功耗约束的应用映射与优化方法。本文提出了一种拓扑结构感知的基于高层代码转换的片上网络应用映射与优化方法。该方法采用多面体模型对应用的核心循环进行自动并行和局部性优化,并将网络拓扑结构抽象成带权重的有向图,使用该有向图对任务流图进行覆盖,以提高任务的并行性,降低任务间同步和通信开销。实验结果表明,采用优化的映射方法后任务节点间的并行性被充分利用,通信开销降低,整体上提高了片上网络系统性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号