首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 52 毫秒
1.
OpenMP的多核并行程序设计   总被引:3,自引:0,他引:3  
介绍一种多核并行编程标准OpenMP,对循环并行化的指令和使用方法进行详细解释,并给出实例证明使用OpenMP对多核环境下程序效率的提高。  相似文献   

2.
随着四核微机走向市场和八十核处理器在实验室研制成功,多核正引领软件研发发生基础性变化。开发人员需要在代码中添加线程来利用系统所提供的多个内核,从而提升PC应用软件的功能和性能。文中探讨在多核微机上进行并行计算的实现技术。介绍了共享存储系统并行编程接口OpenMP的模型、指令和库函数,以及Intel C 编译器9.1和Microsoft Visual Studio 2005等对OpenMP的支持;着重探讨了二维离散快速傅里叶变换并行算法的设计、实现与优化技术;展望了高性能并行计算软构件库的开发前景。  相似文献   

3.
刘凯  寇正 《微型机与应用》2003,22(12):12-14
OpenMP的功能、执行方式和主要指令,用OpenMP对一个描述粒子运动的模式进行了并行优化。  相似文献   

4.
针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。  相似文献   

5.
本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个OpenMP线程,计算结点内针对能群进行多线程并行计算。数值测试结果表明,非结构网格上的粒子输运问题的混合并行计算能较好地匹配多核机群系统的硬件结构,具有良好的可扩展性,可以扩展到1024个CPU核。  相似文献   

6.
提出延迟隐藏的数据预取模型,实现计算与访存的重叠操作,以达到共享二级缓存零缺失;给出基本块的概念,以简化算法的数据结构和减少存储开销;按基本块连续存储方式存储矩阵元素,从存储层次上优化算法,显著地减少页表缓冲缺失;采取非递归调度基本块的策略,充分利用多核计算机的共享二级缓存来减少访问主存的次数,并且不局限于某种特定的存储结构,实现算法缓存无关.多核计算机上的实验结果表明,给出的非递归计算矩阵乘积的线程级并行算法高效、可扩展.  相似文献   

7.
迟利华  刘杰 《计算机工程》2010,36(21):25-27
在分布共享的多核集群系统中,提出一种求解非线性扩散方程的显式数据分布OpenMP并行计算方法。将数据进行分布式划分后分配到每个OpenMP线程,通过数据拷贝实现同步计算,并设计全局归约算法减少障碍同步次数。性能分析和测试结果表明,该方法在 4核Xeon处理器构成的分布共享集群系统上可扩展到1 024个CPU核,相对于64个CPU核,其加速比为7.06。  相似文献   

8.
OpenMP是现代多核机群系统采用的主要并行编程模型之一,在单CPU多核上可以获得良好的加速性能,但在整个机群系统上使用时,需要解决可扩展性差的问题.首先设计了求解非平衡动力学方程的并行算法.基于分布共享的多核机群系统,采用显式数据分布OpenMP并行计算方法,将数据进行分布式划分,分配到每个OpenMP线程,通过数据共享实现数据交换.计算结果表明显式OpenMP并行程序在保持可读性的同时,具有良好的可扩展性,在4核Xeon处理器构成的分布共享机群系统上,非平衡动力学方程组的数值并行计算可以扩展到1024个CPU核,具有明显的并行加速计算效果.  相似文献   

9.
在现代社会中,科学科技水平发展迅速,人们进行不断创新很大程度上是为了提高工作效率,本文介绍了计算机领域中的嵌入式多核处理器优化问题,目前市场上用的比较多的是双核和四核的CPU,而六核的CPU也已经面世多时,所以在多处理机上编写、运行并行程序也变得相当普遍,如何充分认识与利用嵌入式多核的并行计算效率已经成为目前计算机研究的一个重点工作。  相似文献   

10.
为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标.在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行.针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌入式多核平台上的运行效率.扩展后的OpenMP并行程序支持循环分片,从而能够充分利用层...  相似文献   

11.
基于多核处理器的并行编程模型   总被引:3,自引:3,他引:0  
为解决传统编程模型与并行架构间存在的矛盾,针对多媒体和网络应用程序的特点,提出一种基于多核处理器的并行编程模型,该模型采用节点化的并行程序描述方式,将并行编译器划分到多个核上运行。实验结果表明,这种新的并行编程模型能有效提高程序的执行效率。  相似文献   

12.
通过类的数据流分析计算出实例变量的“定义-使用”对信息以及成员函数的前置和后置条件,利用类的继承多态性对被测试类进行预处理。在JPF中设置搜索环境,将测试用例生成问题简化成模型检测中寻找反例的问题,提出一种在多核计算机上实现的线程级并行生成类测试用例的方法。实验结果表明,该方法可以减少测试生成所需的状态数和运行时间,算法可使用的处理核心越多、测试生成所需的时间越少。  相似文献   

13.
多核并行计算中Cache伪共享的研究   总被引:1,自引:0,他引:1  
随着多核计算的快速发展,多核并行计算是多核高性能优势的主要利用之一,而高速缓存在提高计算机性能上有着十分重要的作用。本文首先介绍Cache的基本结构,接着分析在数值型的并行计算中遇到的Cache伪共享问题,最后针对问题给出相应的解决方案,并以具体的实例验证了解决方案的可行性。  相似文献   

14.
对多核环境下的图像分割并行算法进行研究,在基于正交小波分解的多分辨率图像锥中引入模糊C-均值(FCM)算法,采用OpenMP语言设计P-FCM多核并行模型,并给出该模型的算法实现步骤。在对初始图像数据预处理时,采用矩形块数据分割法进行图像分块,将分块后的子图像数据作为并行运算时的输入数据由主线程分给不同的处理器。实验结果表明,在处理较大图像时,该算法效率较高。  相似文献   

15.
作为在桌面系统上兴起的技术,OpenMP在PC平台上已经非常成熟,但是在嵌入式领域,尤其是Android的开发大多还停留在传统的单核模式。Google推出的NDK R9提供了对OpenMP函数库的支持,本文介绍了OpenMp在Android上的运用,并对存在的问题进行了修正。  相似文献   

16.
基于多核微机的微粒群并行算法   总被引:3,自引:1,他引:3       下载免费PDF全文
提出了一种基于Logistic模型的惯性权重非线性调整策略,采用OpenMP多线程编程,在微机上实现了微粒群算法的多核并行计算。通过对BenchMark测试函数集中的5个函数进行测试,试验结果表明,采用基于Logistic模型的惯性权重非线性调整策略在算法成功率和收敛代数都优于线性调整策略,而基于OpenMP的微粒群多核并行计算使得计算速度得到提高。  相似文献   

17.
处理器速度瓶颈促进了多核技术的发展,使传统的文本编程语言面临诸多局限与挑战,LabVIEW图形化编程本质上的数据流执行特性避开了繁琐的底层实现,为编程者提供了并行编程的简化方法,使软件开发能够从多核系统中获得潜在的性能提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号