首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
Open Source     
汤韬 《程序员》2004,(11):13-13
提起 Intel,大家首先想到是它生产的 CPU,不过它可不止生产硬件,它还涉足编译器、性能分析工具、高性能库等软件领域。当然这些工具是针对 Intel 的 CPU 进行开发和优化的。在 x86的架构中,Intel 是目前已知的编译代码质量最好的编译器,相比较以支持尽可能多的平台而著名的 GCC,它能够提升20-30%的性能。不久前,Intel 发布新一版的 C/C++编译器8.1(简称 ICC)。一如既往,它支持 windows 和 linux 两个平台。虽然我们不能指望 ICC 会象 GCC 那样开放源代码,  相似文献   

2.
《数码时代》2005,(5):13-13
Intel宣布,将废止一项适用于部分自家软件的开放源代码授权办法。开放源代码促进会(Open Source Initiative,OSI)将卸载Intel的开源码授权许可,未来不再以OSI认可的授权形式继续使用。OSI是一个非盈利性机构,其宗旨在于推广使用开放源代码软件,并且在OSI网站上公布一份开放源代码软件授权清单。  相似文献   

3.
处理机的指令级并行能力只有通过编译器才得以发挥。代码生成是编译器后端中直接针对目标处理机的优化阶段的集合,因而它是提高目标处理机指令级并行的重要组成部分。ORC(Open Research CompiLer)是一款针对IA-64体系结构的开放源码编译器,它具有丰富的优化阶段和良好的性能。本文介绍了ORC的代码生成的关键技术,这些技术包括区域构造、谓词相关优化、全局指今调度、参数化的机器描述以及微调度。实测结果表明,这些技术取得了显著的优化结果,ORC相对于Pro64能取得平均23%的加速比。  相似文献   

4.
上下文敏感性是程序分析中的一个重要属性,可用来提高函数调用上下文的分析精度,且有利于编译器优化及程序验证。基于Open64开源高性能编译器,实现了一种源代码级上下文敏感性检测算法。通过给出上下文敏感性的分析结果,指导有源代码的建模采用何种上下文敏感性模型,使建立的模型的准确性更高。在基准测试集SPEC2006和NPB 3.3.1的实验结果表明,该算法可有效检测源代码级的上下文敏感性,为相关的软件建模工作提供了理论借鉴。  相似文献   

5.
IDF新闻集锦     
4月26日,英特尔公司与中国科学院计算技术研究所签署合作协议,双方宣布将共同研究开发新一代高级软件编译器。在合作协议规定的两年期限内,双方将对开发下一代处理器和编译器的关键技术进行合作研究。编译器在计算机内的主要任务是将高级编程语言(如C和C++源代码)编制的软件转化为处理器能够识别的二进制语言(机器代码)。英特尔与中国科学院计算技术研究所将就新一代64位架构进行编译器方面的合作研究,它将提高英特尔安腾处理器系列的总体性能和效率,因而将进一步提  相似文献   

6.
本月随着Intel公司宣布开放CDSA(通用数据安全结构)安全软件源代码后,安全软件的开放源代码随之成为热点。 CDSA是一种连接Intel安全设备及应用程序的中间件产品,例如加密/解密、认证、公用密钥服务及生物学测定技  相似文献   

7.
连瑞琦  干戈  吕方 《计算机工程》2004,30(12):37-39,42
介绍了在基于1A64体系结构的高性能优化编译器ORC的性能调试阶段所开发的工具、利用的方法和积累的经验。实验数据部分给出了ORC性能调试阶段的实际情况.证明了文中介绍的工具、经验和方法在找到新的优化机会、快速定位并排除性能下降和保持性能稳步上升等多方面都是行之有效的。  相似文献   

8.
控制与数据投机优化技术的研究   总被引:1,自引:0,他引:1  
控制投机和数据投机是提高程序指令级并行度的有效方法.为了保证投机指令的正确执行,须解决两个问题,即延迟触发控制投机指令导致的异常和数据投机中的别名歧义.这需要硬件的支持才能做到,所以以前在这方面的研究大多是在模拟器上进行的,侧重于描述对模拟器结构的扩展.而IA-64是第一个同时支持这两种优化的体系结构.基于此,作者用一个统一的框架在IA-64开放源码研究编译器(ORC)中首次实现了控制与投机优化.该文以编译器为侧重点,介绍了投机优化中的几个核心问题及其解决方法,其中包括一种新的用来维护投机代码正确性的算法.实验结果表明这种方法是有效的.  相似文献   

9.
软件流水是一种重要的指令调度技术,通过重叠地执行不同的循环体来提高指令级并行性。模调度是一类重要的软件流水调度算法,保守的相关性分析可能会引入较多的模糊相关,这阻碍了模调度生成高效的调度结果。数据猜测能克服保守的相关性分析带来的调度限制,开发潜在的并行性。本文提出了模调度中的一种数据猜测方法,在开放源代码编译器ORC上实现了该方法,并用SPEC2000基准程序进行了测试,实验结果表明,该方法收到了较好的效果。  相似文献   

10.
每月播报     
提到Intel,人们总是会想到它那独霸市场的CPU。其实Intel在编译器领域上同样拥有极深的造诣,特别是当它在几年前收购KAI之后。现在的Intel Compiler已经成了的x86平台高性能编译器的代名词。本月,Intel再次发布了其编译器的最新版本8.0。新版的编译器仍旧包括C++和Fortran两种语言。除了继续在提升编译代码质量和增加对更多Intel CPU支持外,该版本最最大的改进在于对多平台支持更加出色,一个编译器包,即可编译针对Intel包括Itanium2、Xeon、Pentium4、Prescott甚至是Intel的移动和PDA芯片  相似文献   

11.
Dynamic optimization relies on runtime profile information to improve the performance of program execution. Traditional profiling techniques incur significant overhead and are not suitable for dynamic optimization. In this paper, a new profiling technique is proposed, that incorporates the strength of both software and hardware to achieve near-zero overhead profiling. The compiler passes profiling requests as a few bits of information in branch instructions to the hardware, and the processor executes profiling operations asynchronously in available free slots or on dedicated hardware. The compiler instrumentation of this technique is implemented using an Itanium research compiler. The result shows that the accurate block profiling incurs very little overhead to the user program in terms of the program scheduling cycles. For example, the average overhead is 0.6% for the SPECint95 benchmarks. The hardware support required for the new profiling is practical. The technique is extended to collect edge profiles for continuous phase transition detection. It is believed that the hardware-software collaborative scheme will enable many profile-driven dynamic optimizations for EPIC processors such as the Itanium processors.  相似文献   

12.
在程序实际执行中,Profiling技术能为编译器提供准确的轮廓信息。编译优化借助这种轮廓信息,可在优化时进行取舍,提高生成代码性能。该文介绍了在龙芯/ORC编译器中edge profiling的技术,给出了在edge profiling辅助下CPU2000性能测试结果。  相似文献   

13.
This paper describes the design and implementation of an optimizing compiler that automatically generates profile information to assist classic code optimizations. This compiler contains two new components, an execution profiler and a profile-based code optimizer, which are not commonly found in traditional optimizing compilers. The execution profiler inserts probes into the input program, executes the input program for several inputs, accumulates profile information and supplies this information to the optimizer. The profile-based code optimizer uses the profile information to expose new optimization opportunities that are not visible to traditional global optimization methods. Experimental results show that the profile-based code optimizer significantly improves the performance of production C programs that have already been optimized by a high-quality global code optimizer.  相似文献   

14.
针对编译器系统设计和编译中的低功耗优化,基于可重定向编译器,实现在编译器后端对VLIW指令总线进行功耗优化的策略.通过对编译生成的二进制目标码进行横向再调度来减少指令总线上的高低电位切换次数,达到降低系统功耗的目的.对编译后端的软件流水和超块调度两种性能优化策略进行对比实验,表明其优化效果在30%以上,并且代码的指令级并行性(Instruction Level Parallelism,ILP)与优化效果存在明显的相关性.最后,通过ILP对该策略提出改进,以指令级并行信息指导功耗优化,在功耗优化效果损失不大的前提下,可节省多达20%的算法开销.  相似文献   

15.
传统的静态编译器优化存在着各种限制,为此,提出了一种运行期动态优化的对策。在程序的执行过程中,持续检测程序运行的profile信息,并根据这些信息对程序代码进行优化变换,创建并运行程序代码的优化版本。这种运行期动态优化操作是直接针对程序的二进制代码的,不针对程序语言或编译器。这不仅带来优化的透明性,还使得老版本的源代码即遗留代码也可以从优化技术中获得性能提升。  相似文献   

16.
动态二进制翻译与优化技术研究   总被引:2,自引:1,他引:2  
动态二进制翻译技术是一种即时编译技术,它将针对源体系结构编译生成的二进制代码(源机器码)动态翻译为可以在目的体系结构上运行的代码(翻译码).动态优化技术是指在运行时获取动态信息并进行代码优化的技术.动态二进制翻译及优化系统使得源软件无需重编译就可以直接在目标体系结构上高效地运行.目前几种比较有影响的动态二进制翻译及优化系统有Intel公司的IA-32 Execution Layer,IBM公司的DAISY,Transmeta的CMS及HP的Dynamo等.这些系统对动态二进制翻译系统关键技术有不同的实现.对动态二进制翻译和优化技术的研究是计算机领域的研究热点,具有深远的现实意义和应用前景.  相似文献   

17.
基于GCC的VLIW编译系统研究   总被引:1,自引:1,他引:0  
VLIW机器在单个机器周期中同时发射并执行多个的并行操作,从而获得较高的指令级并行度,这些操作之间的依赖分析和调度工作则被完全交给相应的编译器执行,因此VLIW的并行性能能否充分发挥取决于VLIW体系结构相关编译器的质量。GNU开发的GCC是被最广泛使用的编译系统之一,它具有多语言、多平台支持的能力和开放的结构,能够运用各种成熟的常规编译优化技术生成高效的代码。文章分析了VLIW及GCC的结构特点,提出了一种基于GCC的VLIW编译系统设计方案,利用GCC进行RTL中间代码一级的体系结构无关优化和少量体系结构相关优化,在汇编代码一级针对VLIW结构进行体系结构相关的优化,从而充分利用GCC的成熟编译技术快速开发高效的VLIW多语言编译系统。  相似文献   

18.
介绍在GCC编译器中利用值剖视识别收集变量的不变特征信息并指导代码优化工作的方法。NPB基准测试程序的测试结果表明,GCC基于值剖视的优化引入的开销小,与边剖视一起使用时能获得较好的优化效果,在不同程序间显示出一定的优化针对性和局限性,值剖视信息的类型与数量、优化种类等存在较大的改进空间。  相似文献   

19.
该文介绍一种针对IXP网络处理器指令集的编译器优化技术,该技术将位信息记录引入到传统数据流分析过程当中,通过使用模式匹配技术生成高效的目标代码,试验数据表明利用位操作优化最终生成的指令数可以减少1.1%-3.7%。  相似文献   

20.
在国产申威高性能多核服务器系统中,基础编译系统对应用程序中访存操作进行代码生成时,没有考虑国产处理器指令特征,导致编译器生成的访存地址计算代码效率较低,影响国产高性能处理器的性能。为充分发挥国产处理器高性能计算能力,提出一种加速访存地址计算的编译优化方法。加速访存地址计算编译优化基于处理器支持带扩展因子的运算指令,在编译器后端内存地址表达式合法性检查中,添加针对乘加模式的地址计算表达式合法性检查算法,自动识别地址表达式中存在的乘加运算并进行合法性检验,对符合条件的地址表达式在代码生成阶段匹配生成带扩展因子的运算指令来快速计算访存地址,从而加快访存指令的发射与执行以及应用程序中的访存地址生成,提升访存效率。使用行业标准性能测试集SPEC CPU2006对优化效果进行评测,结果表明,相比优化前SPECspeed Integer与SPECspeed Float Point两个子集,该优化方法平均性能分别提高了2.53%与1.50%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号