首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
将异构多核处理器的资源分配问题抽象为一个三维优化空间,空间中的每个元素对应多任务程序的一个并行策略,确定程序有效并行策略的问题转化为优化空间的搜索问题。为了加速搜索,提出一种基于遗传算法的智能搜索方法。实验表明,模型驱动的并行策略选择方法能够在极短的时间内为程序生成较好的并行策略。  相似文献   

2.
图形任务计算的复杂性及实时性要求高速计算。文中提出了一种异构处理器间的图形并行生成方法,在层次分割和多主体协作模式下,各处理器并行运作,一方面有效利用了环境中的计算资源,另一方面提高了各处理器的计算并行度。  相似文献   

3.
异构软件构件组装模型设计与实现   总被引:5,自引:0,他引:5  
毛莺池  梁奕  王志坚 《计算机工程》2005,31(4):56-57,127
研究了异构构件组装方法,根据主流构件模型的差异,设计了异构软件构件组装模型,使构件对外呈现一致的构件视图,屏蔽构件的异构性,有效地利用系统资源,最大限度地为应用系统的生成提供支持。  相似文献   

4.
5.
凭借着高性能,低功耗的特性,多核处理器已经占据了目前的主要市场.提出一种多核处理平台上基于任务图模型的调度策略.建立了多核平台上任务图的空间与时间并行调度模型;针对任务图的空间并行与时间并行调度模型提出了并行节点合并、分配的优化算法与流水线并行的优化算法.最后,提出将优化的空间与时间并行调度技术相结合的并行调度策略.通过实验验证,本文提出的算法比其他多核并行调度算法降低了处理器核心间的通信与同步开销,提高了系统的计算效率与吞吐量.  相似文献   

6.
更实际的异构并行计算模型   总被引:3,自引:1,他引:3  
通过结合多种代表性并行计算模型,给出异构环境中的HBSP模型和程序开销计算方法。采用基于消息长度的线性模型具有通信开销的计算更精确、程序和算法在异构环境中的设计灵活、且可解除原有BSP模型对h-relation的限制等优点。当构成BSP计算机的各处理机速度相同且原有BSP算法达到最优(即各处理机上所分配的计算量与通信量完全均衡)时,HBSP模型等同于原有模型。  相似文献   

7.
基于多核处理器并行系统的任务调度算法   总被引:6,自引:0,他引:6  
针对多核处理器并行系统的特点,提出了相应的任务调度算法,该算法在任务调度之前加入了任务分配技术,通过合理的任务分配,可有效减少多个处理器间的通信开销,使任务调度效率更佳.仿真实现了该算法,并通过实验数据证明了该算法的优越性.  相似文献   

8.
在如今这个信息技术高速发展的时代,嵌入式技术已经在国内各大领域中广泛被应用,并逐渐成为各种移动设备中最为主要的应用技术.由于Java有着非常多的优点,因此成为最近几年社会中广泛认可并且使用的一种编程语言.本文通过对多核处理器中仿真问题的讨论,对异构多核系统方面存在的相关问题进行了一次研究,并将其性能测试相关问题进行了分析.  相似文献   

9.
TBB多核编程及其混合编程模型的研究   总被引:7,自引:0,他引:7  
多核处理器越来越普及,如何通过软件技术最大提升CPU每个核心的使用率,成为热点问题.引入多核并行编程模型Threading Building Blocks,并与raw threads、OpenMP进行各方面详细比较,分析了其优劣.并研究了TBB结合MPI在SMP集群系统上实现高效的混合并行计算应用的方法.最终发现TBB在多核编程方面有显著的优势.TTB和MPI的结合,又为多核处理器结点集群提供了并行层次化结构,大大优化集群的性能.  相似文献   

10.
异构构件组装技术已成为基于构件的软件开发中的关键问题。研究现有构件模型及常用组装方法.结合构件组装中的连接子和胶合代码两种已有的方法,搭建一个异构构件的组装模型.并通过XML语言对原子构件组装成模块(复合构件)的整个组装过程进行描述。这种建模方式,有效地屏蔽了构件的异构性,为基于构件的应用系统开发进行了有益的探索?并取得了一定的成效。  相似文献   

11.
This paper presents the implementation of two connected component labelling algorithms on the BLITZEN massively parallel processor that was developed recently for NASA. The topology of BLITZEN is a two-dimensional mesh that can be dynamically configured to also support diagonal data transfers. It is shown that an algorithm based on Levialdi's connected component shrinking process performs much better than a straightforward algorithm for connected component labelling.  相似文献   

12.
肖红  吴迪 《计算机工程与设计》2007,28(15):3594-3597
网络处理器通常由多个异构的处理和内存单元通过片上网络连接构成,其目标应用需要在Gbit/s到几十Gbit/s的网络环境中以线速处理数据包,具有实时、资源受限和异构的特点,目前的系统设计和开发方法难以达到性能和效率兼顾.通过分析硬件和应用,总结在基于网络处理器的系统中应用组件技术的基本原则,可应用组件技术来解决传统方法的问题.提出的组件模式抽取了网络处理器在硬件体系结构和目标应用方面的特征,可以简化系统建立并能够对系统行为进行预测.  相似文献   

13.
将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速。针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提出面向异构多核处理器的循环分块子句生成算法,并在基于Open64的"源-源"自动并行化系统Auto-ACC中进行实现。测试结果表明,在异构多核处理器上,扩展的循环分块子句及所提生成算法能够对程序进行明显的加速。  相似文献   

14.
近年来,随着半导体技术的发展以及应用多样化的需求,异构多核处理器已被广泛应用于高性能嵌入式系统中。这类系统面临的一个主要挑战就是如何在运行时对系统的可用资源(包括处理核等)进行管理分配从而满足系统及其所运行应用在性能和功耗等方面的需求。然而,虽然目前一些主流的资源管理技术在性能和/或功耗优化等方面取得了良好表现,但却经常对所设计的资源管理部件缺乏严格的可靠性保证,因此提出了一种基于离散控制器合成(DCS)的方法来对异构多核系统的在线资源管理策略进行自动、可靠的设计,即将形式化的、能够自动构造管理控制部件的DCS应用到异构多核系统的在线资源管理部件设计中。该方法通过采用形式化模型来描述异构系统的运行行为(例如如何为应用分配处理核),并将在线资源管理问题转换为一个面向某个系统管理目标(例如最大化应用性能)的DCS问题。在此基础上,通过现有的DCS工具对提出的方法进行了示例演示和验证,并对所使用DCS方法的可扩展性进行了评估。  相似文献   

15.
现有的并行代价模型大多是面向共享存储或分布存储结构设计的,不完全适合异构多核处理器。为解决这个问题,提出了面向异构多核处理器的并行代价模型,通过定量刻画计算核心运算能力、存储访问延迟和数据传输开销对循环并行执行时间的影响,提高加速并行循环识别的准确性。实验结果表明,提出的并行代价模型能有效识别加速并行循环,将其识别结果作为后端生成并行代码的依据,可有效提高并行程序在异构多核处理器上的性能。  相似文献   

16.
In order to exploit the efficient computing power of many integrated cores on heterogeneous cluster, a multi-level and multi-granularity collaborative parallel computing method is proposed for finite element structural mechanical analysis. Computing tasks are divided into three levels: inter-node parallelism, inter-device parallelism and inter-core parallelism. Through mapping decomposablecomput- ing jobs to different hardware layers of heterogeneous MIC system, the proposed method not only effectively resolves the load balancing problem between CPU and MIC devices, but also significantly reduces the communication overheads of the system. Different engineering simulation case experiments for large scale parallel computing were conducted on “Tianhe 2” supercomputer. Up to 39000 CPU+MIC cores were employed and the finite element size of the analysis was more than 100 million units. Test results show that the proposed method can achieve good speedup and parallel computing efficiency in large scale parallel computing of finite element structural analysis. The optimized adaptation of finite element structural analysis and heterogeneous MIC computing platform is realized, which can provide reference for parallel porting and performance optimization of similar applications.  相似文献   

17.
18.
一种面向异构计算的结构化并行编程框架   总被引:1,自引:0,他引:1  
随着人工智能时代的到来,异构计算在深度学习、科学计算等领域发挥着越来越重要的作用。目前异构计算系统在应用上的瓶颈之一在于缺少高效的软件开发框架,已有的OpenCL、CUDA等支持GPU、DSP及FPGA的编程框架基于C/C++语言和传统的并行编程方法,导致软件开发效率较低,软件推理和调试困难,难以灵活处理计算设备之间的协作和调度。提出一种面向异构计算平台的基于脚本语言的结构化并行编程框架,提供结构化的并行编程接口,支持计算任务到异构计算设备的映射,便于并行程序的推理和验证。设计并实现了基于遗传算法的结构化调度算法,充分利用异构计算系统的计算能力,提高了异构计算系统的软件开发效率。实验结果表明,提出的编程框架在CPU+GPU平台上实现了相对于单处理器1.5到2.5倍的加速比。  相似文献   

19.
刘瑜  袁宏春  梁正 《计算机应用》2008,28(2):279-282
在多系统异构局域网中,由于不同操作环境的消息传递接口(MPI)程序缺乏互操作性,使得并行时域有限差分运算(FDTD)难以充分利用局域网内的计算资源。对此,提出利用应用层服务消息块(SMB)协议实现异构FDTD计算,并通过内存文件存取、内存映射数组以及引入冗余计算等方法来缓解与克服SMB通信延迟对并行性能的影响。数值模拟实例验证了新方法的可行性与正确性,所得加速比、并行效率等性能指标参数与常规同构MPI消息传递方法基本相当。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号