首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
并行构件技术作为并行软件工程的主要内容之一,对提高并行计算软件的生产率具有重要意义,也是并行软件工程的重要研究内容。并行构件技术研究现状包含并行构件模型、并行构件体系结构规范、并行构件框架3个方面。并行构件、接口、框架的定义和实现是区分不同并行构件体系结构规范的主要标准。如何在实现并行构件复用性的同时提高并行构件组成的应用系统性能,是这些技术发展的共同思想。单构件多数据、多构件多数据编程模型、多语言互操作技术、并行远程方法调用、MxN问题的解决方法、不同模型构件间的互操作都是并行构件领域的研究成果。并行构件技术的发展方向是开展对多语言互操作、性能预测、自适应构件、构件模型的互操作、多核硬件上的并行构件体系结构技术的研究。  相似文献   

2.
为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标.在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行.针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌入式多核平台上的运行效率.扩展后的OpenMP并行程序支持循环分片,从而能够充分利用层...  相似文献   

3.
李士刚  胡长军  王珏  李建江 《软件学报》2013,24(12):2782-2796
低功耗及廉价性使得异构多核在超级计算机计算资源中占有重要比例.然而,异构多核具有高带宽及松耦合一致性等特点,获得理想的存储及计算性能需要更多地考虑底层硬件细节.实现了一种针对典型的异构多核Cell BE 处理器的多级并行模型CellMLP,通过C 语言扩展编译指导语句,实现了对数据并行、任务并行以及流水并行编程模型的支持,提高了并行程序生产率.运行支持优化方面,数据并行采用SPE 并行数据传输、双缓冲等优化手段来提高数据传输带宽;任务并行使用一种新式混合任务队列以支持异步任务窃取,降低SPE 线程间竞争,提高了任务并行的可扩展性;流水并行首次使用阻塞信号传输机制实现SPE 线程间的低开销同步操作.实验对Stream,NASBenchmark 及BOTS 等应用进行了测试,结果表明,CellMLP 可对多种典型并行应用进行高效支持.与目前同类编程模型SARC 及CellSs 进行性能对比,其结果表明,CellMLP 实际数据传输带宽以及非规则应用的支持方面具有明显优势.  相似文献   

4.
为更好地组装并行构件程序和进行性能优化工作,设计和使用了不同的软件agent.构件连接agent负责构件接口的粘合和数据重分布.构件执行agent和资源管理agent相互协作,把构件部署在满足要求的计算节点上.定义了4种不同的构件自适应策略.不同的构件自适应agent、构件执行agent和资源管理agent相互合作,针对平台计算资源的不同情况,完成构件的自适应过程,提高了构件的性能.资源管理agent、负载探测agent和构件执行agent相互合作,完成负载均衡工作,提高了整个计算平台的性能和吞吐量.在异构计算机集群上的相关实验证明了所提出的基于agent技术的并行构件组装及性能优化方法的有效性.相比传统的性能优化方法,基于agent技术的方法使用灵活,并且具有性能上的优势.  相似文献   

5.
基于事务性执行的投机并行多线程是一种适合未来多核微处理器架构的新型并行程序设计和编译技术.但在此基础上的并行程序执行过程更为复杂,程序执行过程的模拟成为关键问题之一.本文提出利用二进制代码级动态插桩技术对投机并行多线程程序进行功能性模拟,设计并实现了完整的软件平台,可精确地模拟和监控并行程序的线程级投机执行过程,检测访存冲突,从而实现投机并行多线程的语义.该软件平台同时可以作为进一步研究投机多线程并行程序真实执行过程的基础,并有效支持投机并行多线程编译器的设计和分析.  相似文献   

6.
为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案.根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序.利用多核并行编程模式的思想,设计了一个混合并行编程模式,通过Intel的性能分析工具,找出了该算法的热点和瓶颈,对其进行优化.实验结果表明,优化过后的执行时间较原来串行程序的执行时间缩短了50%~60%,同时提高了程序的加速性能,取得了良好的效果.  相似文献   

7.
多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序.自动并行化技术是将单线程程序移植到多核上的重要手段,但是当循环中存在无法确定的数据依赖或复杂的控制流时,传统的自动并行化技术无法取得良好效果.Ottoni等人针对传统自动并行失败的循环提出了Decoupled Software Pipelining(DSWP)算法用以实现指令级的细粒度并行,但其需要对处理器体系结构的深入了解以及对核间通信队列和专用指令的硬件支持,并行性能和应用广泛性受到限制.基于OpenMP应用编程接口实现的DSWP并行不依赖于硬件上对核间通信队列和专用指令的支持,且不受平台的限制,但现有的OpenMP任务调度机制无法满足DSWP并行中对任务调度的需求.对现有的OpenMP任务调度机制进行扩展,增加了任务与线程绑定的属性,保证了基于OpenMP的DSWP并行程序的正确执行.在GCC的OpenMP运行库libgomp中扩展了任务绑定属性子句的功能,扩展后的GCC作为OpenMP DSWP程序的基础编译器,为自动并行提供支持.通过对基准测试集NPB3.3.1的测试表明,传统自动并行失败的循环,经OpenMP DSWP自动并行后在双核处理器上平均加速比达到1.23以上;使用添加了OpenMP DSWP算法的Open64编译器生成的并行程序,与仅使用传统自动并行方法的Intel 编译器和Open64编译器所得程序相比,平均加速比分别高出22%和26%.  相似文献   

8.
基于多核处理器的并行编程模型   总被引:3,自引:3,他引:0  
为解决传统编程模型与并行架构间存在的矛盾,针对多媒体和网络应用程序的特点,提出一种基于多核处理器的并行编程模型,该模型采用节点化的并行程序描述方式,将并行编译器划分到多个核上运行。实验结果表明,这种新的并行编程模型能有效提高程序的执行效率。  相似文献   

9.
扩展了CCA并行构件体系结构,首先定义了一个并行构件非功能属性的一个最小集合,然后实现了对这些属性进行管理的非功能构件。定义了与这些非功能属性相关的接口。并行构件可以有选择地提供这些接口。并行构件向非功能构件注册自己的属性,然后通过非功能接口向非功能构件提供相关信息。为了最优化并行构件的实现,构件开发者需要实现属性管理中属于特定构件的部分,这部分内容在非功能接口中实现。非功能构件调用并行构件的非功能接口,对并行构件的非功能属性进行统一的管理。这种方法提高了并行构件运行的性能,并且为管理并行构件的执行提供了一种简便的方法。  相似文献   

10.
多核处理器并行编程模型的研究与设计   总被引:2,自引:0,他引:2  
为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型.该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并行使用cache块技术划分数据集,多任务并行使用任务密取的任务调度策略.用该模型实现了计算斐波那契数列的递归算法,实验结果表明,使用该模型编写多核并行程序可以达到较高的相对于串行计算的加速比.  相似文献   

11.
This paper presents the implementation of two connected component labelling algorithms on the BLITZEN massively parallel processor that was developed recently for NASA. The topology of BLITZEN is a two-dimensional mesh that can be dynamically configured to also support diagonal data transfers. It is shown that an algorithm based on Levialdi's connected component shrinking process performs much better than a straightforward algorithm for connected component labelling.  相似文献   

12.
基于数据驱动的构件服务软件框架研究   总被引:3,自引:0,他引:3  
陈章 《计算机工程与应用》2005,41(18):39-41,105
随着Internet上提供在线复用的构件增多,用这种构件组装软件系统就成为可能。该文对分布式构件服务软件框架和并行计算模型进行了分析,提出了一种用数据驱动原理激活构件服务的并发构件软件框架。与传统的分布式系统并行计算模型相比,采用新框架组装的软件系统在并行性设计方面表现出强友好性与灵活性。  相似文献   

13.
14.
一个科学计算领域的面向对象并行应用框架   总被引:2,自引:0,他引:2       下载免费PDF全文
本文讨论了一个面向对象的分布式并行应用开发环境POOMA。  相似文献   

15.
董文永  李元香 《计算机学报》2002,25(11):1236-1242
由于仿真对象的复杂性,一些仿真模型很难用有效的解析函数来表达,同时演化算法不要求优化目标具有连续,可导等特点,因此,演化算法用于仿真优化具有很大的优越性,针对仿真优化这一领域提出了演化仿真优化的概念及其形式化语言描述,并给出了演化仿真优化的算法实现框架,演化仿真优化的模型评估需要大量的计算时间,根据仿真优化的特点,提出主/从模式,粗粒度孤岛仿真优化模型及它在PVM,DCOM下的实现,并给出了两个控制器优化设计的实验,仿真试验的结果表明:对于演化仿真优化来说主/从模式的并行度要高于粗粒度孤岛模型,并得出以下结论,对于演化仿真优化来说仿真模型越复杂,主/从模式的性能越好。  相似文献   

16.
针对很多结构有限元程序需要使用数值方法进行系统方程组求解的共性特点,提出对数值求解部分进行构件化设计,形成求解器服务,用于面向对象有限元并行计算框架PANDA为不同应用类型的有限元程序开发提供数值算法.将美国Livermore国家实验室开发的数值求解器库HYPRE作为数值求解构件集成到PANDA框架中,利用其提供的数值...  相似文献   

17.
用倍增技术在带有Wormhole路由技术的n×n二维网孔机器上提出了时间复杂度为O(log2n)的连通分量和传递闭包并行算法,并在此基础上提出了一个时间复杂度为O(log3n)的最小生成树并行算法.这些都改进了Store-and-Forward路由技术下的时间复杂度下界O(n).同其他运行在非总线连接分布式存储并行计算机上的算法相比,此连通分量和传递闭包算法的时间复杂度是最优的.  相似文献   

18.
本文围绕当前应用领域对并行计算的需求趋势,阐述了高性能计算中的并行构件开发技术的应用前景。提出了分步实现领域专用的SPMD模型下并行库的思想。在此基础上,以神威并行计算机为依托,初步实现了一个颗粒流体系统拟颗粒模拟并行库的设计。实验表明,该方法能有效提高并行程序的开发效率。  相似文献   

19.
主成分分析是信号处理和数据统计领域内非常重要的分析工具.针对现有多个主成分提取算法收敛速度慢的问题,提出了具有快速收敛速度的神经网络算法.该算法能够并行提取信号中的多个主成分,而不需要其他额外的操作.分别采用平稳点分析法和随机离散时间分析法对所提算法的收敛性和自稳定性进行了证明.仿真实验表明,相比现有算法,所提算法不仅具有较快的收敛速度,而且具有较高的收敛精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号