首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
在对现有并行编程方法研究的基础上,提出一种基于模式的CPPVM并行编程方法。介绍该方法中并行编程模式的设计与实现,以2个典型应用实例说明使用其进行问题的并行求解与并行程序开发的过程。该方法对于降低并行程序的开发难度,提高并行编程的可靠性与开发效率具有重要意义。  相似文献   

2.
基于模式的并行编程环境中任务队列模式的研究与实现   总被引:1,自引:0,他引:1  
并行程序的设计是并行计算的难点之一。本文在基于模式的并行编程方法的基础上,对一种典型的并行计算与通信模式-任务队列模式进行了深入的研究,并在基于模式的并行编程环境中对该模式进行了实现。本文将通过两个典型的应用实例说明在基于模式的并行编程环境中使用任务队列模式进行问题的并行求解与并行程序开发的过程,并从实现效率和可编程性方面对使用任务队列模式的并行程序和传统的MPI/PVM实现的并行程序进行了分析与比较。  相似文献   

3.
C*语言是通过对ANSIC语言进行进行语法和语义的扩展得的支持SIMD模式的数据并行语言。它允许用户基于一个SIMD虚机描述数据在各个虚处理机上的分布以及对这些数据的并行计算操作,提供了一处简单,有效并与任何特定的机器无关的数据并行编程模型。介绍了C*语言在超级计算机领域中的应用和C*并行扩成分,并给出了典型的编程实例。  相似文献   

4.
根据基于PIM(Processor-In-Memory)技术的数据并行计算机体系结构的特点和面向多媒体计算的应用需求,提出了面向嵌入式SIMD(Single Instruction Multiple Data)计算的数据并行语言PIMC。简单讨论了PIMC语言的形式化定义,并以数据并行图像处理的均值滤波算法为例对语言的使用作了说明。结合其他大量的数据并行编程实例,说明了该语言能够在基于PIM技术的SIMD并行计算机上正确描述基本多媒体处理算法的数据并行实现。  相似文献   

5.
李士刚  胡长军  王珏  李建江 《软件学报》2013,24(12):2782-2796
低功耗及廉价性使得异构多核在超级计算机计算资源中占有重要比例.然而,异构多核具有高带宽及松耦合一致性等特点,获得理想的存储及计算性能需要更多地考虑底层硬件细节.实现了一种针对典型的异构多核Cell BE 处理器的多级并行模型CellMLP,通过C 语言扩展编译指导语句,实现了对数据并行、任务并行以及流水并行编程模型的支持,提高了并行程序生产率.运行支持优化方面,数据并行采用SPE 并行数据传输、双缓冲等优化手段来提高数据传输带宽;任务并行使用一种新式混合任务队列以支持异步任务窃取,降低SPE 线程间竞争,提高了任务并行的可扩展性;流水并行首次使用阻塞信号传输机制实现SPE 线程间的低开销同步操作.实验对Stream,NASBenchmark 及BOTS 等应用进行了测试,结果表明,CellMLP 可对多种典型并行应用进行高效支持.与目前同类编程模型SARC 及CellSs 进行性能对比,其结果表明,CellMLP 实际数据传输带宽以及非规则应用的支持方面具有明显优势.  相似文献   

6.
一种基于设计模式的三阶段并行程序设计方法   总被引:7,自引:1,他引:7  
并行程序的可编程性是并行计算的难点之一,使用传统的方法对非数值问题进行并行求解则更加困难。通过对设计模式概念的扩展,定义了算法模式与结构模式,以此为基础提出了一种基于设计模式的三阶段并行程序设计方法,并通过算法模式库与结构模式库实现对该方法的系统支持,该方法不仅可有于一般的数值问题求解,而且在处理复杂的非数值问题时与传统方法相比要简单得多,通过一个简单的数值问题和一个复杂非数值问题作为实例说明了使用这一方法进行问题并行求解与并行程序设计的过程。  相似文献   

7.
在分析LOD内在并行性的基础上,利用通用的并行编程环境OpenMP对其进行线程化,提出了一种基于四叉树网格划分的并行简化算法,并在四核计算机上应用Intel parallel amplifier分析器按函数查看性能变化,对比优化前后的数据,结果表明并行化后的加速比和计算效率有了显著提高。  相似文献   

8.
传统并行编程模型和框架不能有效利用和发挥GPU异构并行系统特点,应用开发难度大,性能优化困难,文中采用混合编程模型思想,建立了一种以协处理器为中心的GPU计算核心与CPU控制相融合的多任务流编程模型.模型将并行任务与CUDA流相结合,利用系统硬件并行性特点实现程序任务级和数据级并行;采用任务间消息通信和任务内数据共享通信方式,既保证对传统并行应用的继承又降低了不同存储空间给应用开发带来的复杂性和难度.基于该编程模型实现了一个运行时支持系统原型,测试结果表明可保证高效的数据通信,且能充分利用系统计算能力,提高了应用程序运行效率.  相似文献   

9.
异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战,因此研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能有效描述国产众核系统的异构并行性,与其它众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据表明,Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用.  相似文献   

10.
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大提高了在GPU集群中编程的复杂度。主流GPU异构集群系统大多采用针对GPU的异构计算编程模型与面向分布式内存的消息传递模型的简单结合方式,这种方式使得GPU集群程序设计缺乏确定的准则,往往是低效而且易错的。为了提高在GPU集群中编程的效率,降低编程复杂度,以及实现平台无关性,提出一套异构GPU集群的并行分布式编程的解决方案。该方案通过采用扩展语言方法提出了编程框架DISPAR,并实现了预处理器系统StreamCC。实验证明了其可行性。  相似文献   

11.
孙敏  孙济洲  于策 《计算机工程与设计》2007,28(11):2513-2515,2523
并行结构骨架理论提供了一种描述并行程序设计模式的通用模型,对设计模式进行更高层次的抽象,能有效解决基于设计模式的并行程序设计方法的局限性问题,降低并行程序设计开发难度.基于并行结构骨架的并行程序设计环境--PASBPE在并行结构骨架理论的基础上,使用参数化设置快速生成用户所需并行程序框架,同时通过可视化的程序设计交互环境,简化并行程序的开发过程,提高开发效率.  相似文献   

12.
基于PVM的C++对象分布并行机制的初步研究   总被引:2,自引:0,他引:2  
李毅  周明天  虞厥邦 《软件学报》2001,12(2):173-182
对象具有内在的并行性.将面向对象程序设计与分布并行处理相结合,可产生既具有面向对象特征,又充分利用资源,还可缩短作业运行时间的对象分布并行系统.提出了一种基于PVM(parallelvirtualmachine)的C++对象的分布并行机制.该机制以协议和pvmlib作了向后兼容扩充的PVM系统为对象分布并行支撑;用预处理器将用户作业的并行类分离,并派遣到(PVM)系统中的目标机进行异地编译、加载执行;通过把并行类映射为PVM任务,请求对象消息映射为请求PVM任务消息来实现并行类对象的分布并行.实验结果表明,此对象分布并行机制(当问题规模达到一定程度时)可提高系统资源利用率和程序运行效率,并能简化PVM应用编程.  相似文献   

13.
PC集群及其并行程序性能的实用检测方法   总被引:4,自引:0,他引:4  
随着微处理器、网络技术和并行编程环境的发展,给集群系统尤其是对适合我国国情的PC集群的开发和应用带来了机遇。廉价的PC集群是以其高难度的并行编程要求为代价的,通常用户应用程序的运行速度往往都很不理想,所以如何在用户级实现对应用程序有效速度的检测,进而提供改进程序设计的信息以提高效率就显得至关重要。该文着重就几种在MPI编程环境下如何利用嵌入的MPE技术检测并行程序性能的实现方法进行了分析研究。  相似文献   

14.
考虑到实现确定学习理论中的动态模式识别过程耗时过多,提出一种适用于识别过程计算的多核并行技术。以压气机Mansoux模型为研究背景,首先对其模式获取和识别的过程进行简单描述,其次,在四核PC的硬件平台上,使用OpenMP编程,实现了对动态模式识别的并行计算。通过设置不同的线程数,讨论了几个影响并行程序性能的重要因素。结果表明,要综合考虑各种因素的影响才能设计出高效的并行识别程序。  相似文献   

15.
PSEE (Parallel System Evaluation Environment) is a software tool that provides a multiprocessor system for research into alternative architectural decisions and experimentation, with such issues as selection, design, tuning, scheduling, clustering and routing policies. PSEE facilitates simulation and performance evaluation as well as a prediction environment for the design and tuning of parallel systems. These tasks involve cycles through programming, simulation, measurement, visualization and modification of parallel system parameters. PSEE includes a parallel programming tool, a simulator for link oriented parallel systems, BOLAS, and a performance evaluation tool, GRAPH. These PSEE modules are tools oriented to support the above tasks in user-friendly, interactive and animated graphical form. PSEE provides quantitative information in a graphical tailored form. This numerical/graphical output helps the user make decisions about his/her particular development.  相似文献   

16.
张云泉  施巍松 《软件学报》2000,11(12):1674-1680
用户在编写并行程序时,通常是把物理处理器看成逻辑的处理器(进程)网格,以便于算法的实现.随着用户可用处理器的不断增多,可选择的网格形状也随之增加,如何为基于消息传递的并行程序选择合适的、能发挥出并行机潜在性能的处理器网格形状,是一个迫切需要解决的问题.在提出基于通信点概念的最小度数通信点集合法之后,通过对并行程序通信模式的分析,试图解决与负载平衡无关的并行程序的最适处理器网格选择问题.通过对ScaLAPACK软件包中的一个并行测试程序——并行Cholesky(对称正定矩阵分解)通信点集合度的分析,此方法成功地选择了最适处理器网格形状,并与实验结果相一致.  相似文献   

17.
介绍了MPI并行编程环境和MPI并行程序设计的特点,讨论了在MPI并行程序设计中实现动态负载平衡的方法,提出一种根据计算节点的计算能力和实时负载情况进行任务迁移的动态负载平衡策略。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号