共查询到20条相似文献,搜索用时 93 毫秒
1.
文章基于多核机群系统对并行编程模型进行了深入研究,实现了多层次并行体系结构的OpenMP/MPI混合编程模型的设计.在以SMP机群系统为背景的情况下,实现其节点间和节点内的分层,运用多层次的并行编程模型进行实验与分析.同时对多层次并行编程模型的性能进行深入的研究,提出了一种大同步混合设计新思路.设计了N-Body问题的大同步优化并行算法,并在曙光TC 5000A机群上与传统的并行算法作了性能方面的比较.通过理论研究并结合大量的实验分析统计,得到了多核机群的混合并行编程模型的性能优化的诸多结论. 相似文献
2.
3.
刘钢锋 《微电子学与计算机》2013,30(2)
随着微处理器技术的发展,GPU/CPU的混合计算已经成为是科学计算的主流趋势.本文从编程的层面,介绍了如何利用已有的并行编程语言来,调度GPU的计算功能,主要以MPI(一种消息传递编程模型)与基于GPU的CUDA(统一计算设备架构)编程模型相结合的方式进行GPU集群程序的测试,并分析了CPU/GPU集群并行环境下的运行特点.从分析的特点中总结出GPU集群较优策略,从而为提高CPU/GPU并行程序性能提供科学依据. 相似文献
4.
基于SMP集群的MPI+OpenMP混合编程模型及有效实现 总被引:12,自引:1,他引:11
SMP集群混合了两个内存模型:每个节点是一个共享存储的多处理器,而节点间使用分布存储。这一多级体系结构引起了编程模型和性能方面的问题。文章讨论了MPI+OpenMP混合编程模型的性能和不同的实现方法,提出了多粒度MPI+OpenMP混合编程方法。建立了对称三对角特征问题的多粒度混合并行算法.并在深腾6800超级计算机上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。 相似文献
5.
6.
《电子技术与软件工程》2016,(1)
以多处理器节点集群计算机为平台,构建了MPI-Open MP混合并行的层次化结构模型。然后以三维金属圆柱FDTD散射计算为算例,将单独使用MPI和MPIOpen MP混合编程情况下结果的加速比进行了比较,并借此做了通信与计算重叠试验,不仅验证了混合方法的有效性,而且可以看出在多处理器集群计算系统上运用MPI-Open MP模式能进一步提高加速比和带宽利用率。最后,通过对附加通信量、负载平衡以及网络通信性能等因素对FDTD并行计算产生的影响进行讨论,可以进一步得出构建局域网的硬件性能、子区域的不同划分以及通信原语言的软件设计对并行加速比和效率具有明显影响,而带宽利用率的提高则系于负载平衡问题的改善。 相似文献
7.
通过现阶段的并行编程情况,介绍了几种常用的并行编程模型,每种模型的适用情况各不一样,通过介绍基于任务的并行编程模型,能够看出任务并行的优点,程序员的工作不再繁重,而且其效率和性能更高。 相似文献
8.
实现了计算电大均匀介质体散射问题的高效混合并行混合场积分方程(Electric and Magnetic Current Combined-Field Integral Equation, JMCFIE)求解, 在单纯消息传递接口(Message Passing Interface, MPI)并行基础上采用共享存储并行编程(Open Multi-Processing, OpenMP)进一步提升性能.该混合MPI与OpenMP的并行多层快速多极子技术通过灵活的进程和线程策略, 提升了负载平衡和可扩展性.数值实验展示了此混合MPI与OpenMP的并行多层快速多极子技术的计算能力, 计算了不同尺寸的电大目标体(包含一个半径120 m、1.1亿未知数目的介质球). 相似文献
9.
基于MPI的集群系统的研究 总被引:1,自引:0,他引:1
MPI 是目前集群系统中最重要的并行编程工具, 它采用消息传递的方式实现并行程序间通信.本文研究如何实现一个基于MPI的集群计算系统,并利用一个并行程序实例设计了一个linux集群,对linux集群系统进行了性能评测 相似文献
10.
11.
并行化程序的出现大大提高了应用程序的执行效率,多核程序设计时需要对程序的性能进行考虑。本文重点讨论OpenMP编程模型中多核多线程程序在并行化开销、负载均衡、线程同步开销方面对程序性能的影响。 相似文献
12.
13.
细粒度并行计算编程模型研究 总被引:5,自引:1,他引:4
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的多核心微处理器进入主流市场,与之相适应的编程模型发展却相对滞后.对细粒度的并行计算编程模型进行研究.首先,介绍3种典型的多核心微处理器体系结构;其次,介绍3个已有的细粒度并行计算编程模型;最后,探讨并行计算编程模型的必备条件. 相似文献
14.
随着信息技术的不断发展,在xPC实时半物理仿真平台中单核处理器的运算速度与性能已经不能满足实验需求。在单核目标机上以串行的方法执行模型出现越来越多的瓶颈,模型越来越复杂,计算量越来越大,单核已经不能满足其要求。采用多核是一种比较方便、快捷的解决方式。本文提出了在多核目标机上建立并行执行模型的方法,并使用分析工具分析任务如何在多核上分配的。并采用同一模型分别在任务分配前和任务分配后运行的对比实验验证了建立并行执行模型的优越性。这种并行执行模型的方法已成功应用于某型号无人机的半实物仿真试验。 相似文献
15.
HPMR:多核集群上的高性能计算支撑平台 总被引:6,自引:1,他引:5
HPMR是建立在多核集群上的高性能计算支撑平台,它继承并改进了MapRedcue并行编程模式,使其适合高性能计算需求.HPMR让并行程序的编写和运行变得非常简单,同时又保持很高的性能.HPMR的实用功能不但使并行程序变得易于扩展和移植,而且增强了并行程序的健壮性. 相似文献
16.
实现了一个用于探索基于片上网络通信架构多核系统设计空间的可配置仿真平台--NoC_MPSim.该平台包含处理器工具链、平台自动化配置脚本以及一个包含处理器、网络适配器以及多种路由器的RTL模型库,可根据用户输入的系统配置信息自动生成周期精确的多核仿真系统.针对片上网络通信架构的特征,定义了基于该通信架构的多核系统的高层次通信抽象模型,并借鉴并行机中的消息传递机制,提出了一种可有效隐藏网络乱序的并行编程模型及其通信原语,并完成其所需要的软\硬件建模.应用提出的编程模型,实现了MUSIC算法基于四核仿真系统的分布式并行计算,并经实验得到该并行MUSIC算法在该系统中加速比可达2.6. 相似文献
17.
要使多核处理器充分发挥并行计算性能,最大的挑战是并行编程模型.目前并行线程使用锁来保证线程间的同步,但锁会带来死锁等错误,并且性能很难优化.事务存储模型将一系列共享存储操作看成一个事务,保证其原子性,一致性和隔离性.它可以取代锁结构,简化编程模型,提高并行计算的性能.介绍了一种软件事务存储模型(Buffering Software Transactional Memory,BSTM)的结构,它主要采用了写缓冲的办法,简化了事务模型的设计.实验的结果表明这种模型存在一定的优势. 相似文献
18.
针对Image Quilting纹理合成算法的新旧纹理块拼接特点,研究了一种创建多任务实现纹理块切割拼接的并行编程模式.设计了重叠区域缝合路径计算的多任务模块函数iq(),利用MATLAB多核集群中创建的调度器将子任务分配到各个节点上并行执行计算.实验结果表明,该算法获得了较好的加速比,提高了多核CPU的使用效率,有效地提升了多核计算机资源的利用率. 相似文献
19.
多核DSP编程技术研究 总被引:1,自引:0,他引:1
数字信号处理器(DSP)是对数字信号进行高速实时处理的专用处理器。当前,基于单核结构的嵌入式处理器越来越不能满足日益增长的数据处理应用方面的要求,单纯的增加单个处理器的处理速度更会带来难以接受的能耗。多核嵌入式结构已成为解决这一问题的有效途径,也使整个系统只用DSP搭建成为可能,但同时也为如何开发充分利用多核结构的应用... 相似文献