首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
SIMD(Single-Instruction-Multiple-Data)体系结构在现代处理器体系结构中扮演重要的角色。多种国产高性能通用处理器也大都实现了SIMD结构。SIMD体系结构提供了短向量数据并行处理能力,编译器自动向量化是应用程序获得性能提升的主要手段之一。使用成熟的支持SIMD的商用处理器平台评估典型编译器自动向量化的效果,对于处理器体系结构的设计以及编译器的分析和设计非常有益。采用SPECCPU2006和SPECOMPM2001基准测试程序,评估了典型编译器(包括Intel编译器、PGI编译器和GCC编译器)的自动向量化的效果。并且以产品级的开源编译器GCC为目标,用手工编写的程序片段(主要是多种类型的循环结构)评估了当前GCC编译器自动向量化的效果,并深入分析了GCC编译器中现有的自动向量化的能力和局限。此项工作为进一步研发高效的编译器自动向量化提供了有价值的参考。  相似文献   

2.
1 引言为便于开展对计算机体系结构、编程语言和编程环境的研究,必须能够快速地产生高质量的编译器。编译器的构造是一个繁琐的工作,经常是一个瓶颈。在通常情况下,尽管必须修改的成份仅占整个编译器的一小部分,但却要重新构造整个编译器。在编译器成份和算法方面虽已积累了丰富的研究成果,尚未能为广泛编译器开发者所共享。随着嵌入式系统的迅速发展和高性能体系结构的推陈出新,对编译器的开发速度和质量提出了新的挑战和需求。为此,人们在编译基础设  相似文献   

3.
主从式单边异构体系结构的异构多核处理器广泛应用于面向专门应用领域的计算加速,如异构多核嵌入式处理器、DSP、SoC等;高性能的该类处理器也可用于一些大规模科学和工程计算问题的处理。主从式单边异构处理器对编程模型和编译技术提出了很多挑战性问题,如编程模型的选择、编程语言的设计、编译器架构设计以及运行库的设计等。本文分析了这一类处理器结构特点和执行模型,认为功能卸载模型是最适用于这一体系结构的编程模型;并分析了面向功能卸载模型的编程语言设计关键问题,提出了编译系统的架构,讨论了相应的运行库设计问题。  相似文献   

4.
本文基于斯坦福大学设计的KernelC编译器ISCD,针对64位流处理器体系结构,设计实现了其核心VLIW编译器,并针对高性能计算应用需求进行优化,实现了分布式寄存器负载均衡和指令自动合并技术。实验结果表明,该编译器能够很好地开发程序中的并行性,具有较高的效率。  相似文献   

5.
汉语编程编译器 汉语编程编译器即汉语编程系统核心,它用于执行汉语编程程序编辑器所编写的程序,自身也可编写并执行程序.编译器界面比较友好,操作非常简单,执行效率高,具有很好的交互性.  相似文献   

6.
豆儿 《软件世界》2008,(11):36-37
“当今全球高性能计算系统的计算能力正在飞速发展,这与处理器、编译器和软件等多方面综合因素是密不可分的。英特尔在光互连方面以及硅光学方面都走在世界前沿,今后,英特尔会在高性能计算市场有更多动作。”英特尔公司高级副总裁兼数字企业事业部总经理帕特基辛格博士在今年4月上海IDF上曾经明确了英特尔在高性能计算方面的方向。  相似文献   

7.
高性能计算服务环境主要面向用户、科研团队提供高性能计算服务.随着环境接入的超算中心以及应用社区和业务平台越来越多,超算中心以及社区和业务平台的用户希望能够使用原有账号登录高性能计算环境使用资源.高性能计算服务环境目前提供的应用编程接口仅支持通过LDAP认证的网格账号.为使得应用社区和业务平台用户使用自己原有的登录方式认证通过后就可访问高性能计算服务环境,我们重新设计开发了高性能计算服务环境应用编程接口.本文着重介绍新版应用编程接口的结构与部署实现,并通过用例来说明如何调用新版接口.新版接口为社区和业务平台接入高性能计算环境提供了更方便且安全地支撑.  相似文献   

8.
编译器前端乘幂运算的实现与优化   总被引:1,自引:0,他引:1  
乘幂运算是最基本的数学表达式之一,并且被大多数编译器支持,在高性能计算和密码算法中应用十分频繁。为了实现和优化乘幂运算人们提出了许多算法,比如加法链算法。该文描述了在编译器前端一个具体的新的算法,它实现了乘幂运算并且进行了优化,优化方法结合了静态最优加法链算法和Window算法。这个新的算法已经应用于GNUFortran95编译器(Gfortran),并取得良好效果。  相似文献   

9.
张铎  王生原  董渊 《计算机工程》2010,36(21):239-241
基于开源高性能编译器Open64,以PowerPC嵌入式处理器为例,开展重定向关键问题研究和代码实现,自主开发完成一款具有工业产品水准的高性能开源编译器后端。gcc-c.torture和SPEC2000实测结果表明,在正确性和性能方面,该编译器均接近或达到和GCC编译器相当的水平,为进一步研究和应用提供良好的编译工具支持以及实现参考,同时为后续自动重定向等工作奠定基础。  相似文献   

10.
事务存储并行程序编程接口研究   总被引:1,自引:0,他引:1       下载免费PDF全文
事务存储并行程序编程接口按照实现方式和实现层次的不同,分为三种形式:库函数接口、语言扩展和编译器指导命令。本文以RSTM、英特尔C/C++软件事务存储编译器原型和OpenTM为例,讨论了三种事务存储编程接口的特点,对OpenTM编程接口进行了扩展和完善,并对未来编程接口的发展进行了展望。  相似文献   

11.
我国在高性能计算专业人才培养方面存在短板,传统的课堂教学中理论学习居多,实践环节偏少。为提升我国高性能计算人才的培养水平,提供一个灵活可用的高性能计算教育实践平台成为一个亟待解决的问题。本文设计并实现了一个面向高性能计算的在线教育实践平台系统,包括在线课程模块、题库模块、互动社区模块、虚拟实验室模块。基于该系统,教师可以在线开展高性能计算的理论和实践教学,布置高性能计算相关作业和并行编程任务,也可以创建高性能计算题库。学生可以在线学习相关课程、提交课程作业、交流讨论、进行高性能计算编程练习。本系统的开发可以提升目前高性能计算相关课程实践教学的水平,方便同学们进行课程实践学习。  相似文献   

12.
魂芯DSP是一款采用VLIW和SIMD架构的针对高性能计算领域而设计的32bit静态标量数字信号处理器.为了满足数字高性能计算的性能要求,魂芯DSP提供了丰富的复数指令,而编译器不能直接利用这些复数指令来提升编译性能.因此针对魂芯DSP芯片提供了大量的复数类操作指令的特点,在传统开源编译器Open64的编译框架基础上进行研究,实现了复数作为编译器基础类型和复数运算操作的支持.同时,通过识别特定的复数类操作的模式利用魂芯DSP上的复数类指令对程序编译优化.实验结果表明,该实现方案在魂芯DSP编译器上对复数程序优化后能够取得平均5.28的加速比.  相似文献   

13.
试析C#编程语言的特点及功能   总被引:1,自引:0,他引:1  
如今,从C#编程语言的发展前景分析,其可能在多个操作系统平台中编写各种实现,而从现实应用情况来看,大多数操作人员及编译器供应商已经将C#作为创建编译器版本的标准.本文从工作实践出发,主要对C#编程语言的特点及功能进行了探讨分析.  相似文献   

14.
介绍了对高性能计算机进行并行计算时所必需的基本环境构建情况,包括ssh配置、编译器f90安装及设置、并行mpi软件配置等,还进行了高性能并行计算环境下的应用试验,如对气象并行软件grpaes进行了编译,并在指定相关节点的情况下实现了高性能运行计算。最后通过对高性能计算机进行并行效率试验,找出同样计算规模的grapes模式进行并行计算时所应使用的最佳节点数。  相似文献   

15.
HPMR在并行矩阵计算中的应用   总被引:2,自引:1,他引:2       下载免费PDF全文
为了解决传统并行编程难度大、效率低的问题,提出一种基于MapReduce模型的并行编程方法,在高性能MapReduce平台上实现矩阵并行LU分解。实验结果表明,相比传统并行编程模型,MapReduce模型并行程序可较好满足高性能数值计算需求,其编程简洁性和可读性能有效提升并行编程效率。  相似文献   

16.
监控组态软件在工业控制中的应用越来越广泛,对用户编程接口的支持显得日益重要,本文对组态软件中用户编程接口进行了研究,在充分考虑监控组态软件行业应用特点的基础上,设计了一种组态语言——INVA语言,对其编译器及开发环境的实现方案进行论述,并对语言设计、语法分析、语义分析及编译器的实现进行了深入的讨论,并给出了其实现方案。该方案已经成功运用辽宁省教育厅重大项目“工业现场智能化设备的嵌入式软件构件平台研究”中,证明了该编译器的有效性。  相似文献   

17.
VLIW编译器实现指令并行性挖掘、相关性检查、指令调度等职能,对VLIW处理器的性能影响较大.本文基于一款VLIW DSP芯片,利用可重定位编译器IMPACT的前端和代码生成器模板,设计和实现了高性能的VLIW编译器.利用伪数据类型和Intrinsic函数结合,在编译器中构建了对SIMD功能的支持.实验结果显示,对比基于GCC版本的编译器,该编译器生成的指令数平均下降42%,并行包数下降30%.  相似文献   

18.
当前GPU集群的主流编程模型是MPI与CUDA的松散耦合,采用这种编程模型进行编程,存在编程复杂度大、程序的可移植性差、执行效率低等问题。为此,提出一种面向通用计算GPU集群的任务自动分配系统StreamMAP。对编译器进行改造,以编译制导的方式提供集群任务的计算资源需求,通过运行时系统动态地发现、建立并维护系统资源拓扑,设计一种较为契合GPU集群应用特征的任务分配策略。实验结果表明,StreamMAP系统能降低集群应用程序的编程复杂度,使之较为高效地利用GPU集群的计算资源,且程序的可移植性和可扩展性也得到了保证。  相似文献   

19.
从分布式对象到Web服务   总被引:10,自引:1,他引:10  
1引言为便于开展对计算机体系结构、编程语言和编程环境的研究,必须能够快速地产生高质量的编译器。编译器的构造是一个繁琐的工作,经常是一个瓶颈。在通常情况下,尽管必须修改的成份仅占整个编译器的一小部分,但却要重新构造整个编译器。在编译器成份和算法方面虽己积累了丰富的研究成果,尚未能为广泛编译器开发者所共享。随着嵌入式系统的  相似文献   

20.
VC6.0与MATLAB7.X混合编程方法研究   总被引:2,自引:0,他引:2  
VC 与MATLAB混合编程,可以将VC优秀的可视化编程能力和MATLAB强大的计算能力结合起来.分析了C语言与MATLAB7.X在接口的特点,详细介绍了VC 6.0与MATLAB7.X混合编程的三种方法:MATLAB引擎、MATLAB编译器和MATLAB COM编译器.比较分析了各种方法的适用范围,介绍了发布混编程序的方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号