首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
OpenMP的多核并行程序设计   总被引:3,自引:0,他引:3  
介绍一种多核并行编程标准OpenMP,对循环并行化的指令和使用方法进行详细解释,并给出实例证明使用OpenMP对多核环境下程序效率的提高。  相似文献   

2.
Smith-Waterman算法OpenMP并行化   总被引:1,自引:0,他引:1  
基因比对可以实现对诲量生物信息的分析和处理,其中Smith—Waterman算法实现的比对信息精确度较高,但是处理速度慢。本文利用共享存储编程的工业标准OpenMPX;ySmith-Waterman算法进行了并行化实现。在一个拥有四个双核CPU的SMP节点上的测试表明,共享并行化使得该局部比对算法的速度提高了40%。  相似文献   

3.
研究了一种基于OpenMP技术的多核架构下并行蚁群算法,通过在TSP问题中的实验表明,该算法易于操作,而且充分利用了多核处理器并行计算的优势,提高了算法的运行效率。  相似文献   

4.
根据动态火力分配中"动静结合"的思想,建立了一种带毁伤概率门限的火力分配模型。针对协同空战的第一阶段,在求得对目标机群最大毁伤效果的同时尽量节约导弹武器资源,以应对下一阶段的火力分配。根据粗粒度的并行策略,采用OpenMP并行优化技术对蚁群系统(ACS)中最耗时的循环迭代、循环赋值部分进行并行化处理,在此基础上,将优化后的蚁群算法应用到空战火力分配中,通过对各种规模的火力分配问题进行仿真实验,并验证所提出的火力分配模型的合理性和并行蚁群算法的有效性。  相似文献   

5.
共轭梯度法是为求解线性方程组而独立提出的一种常用的数值计算方法,被广泛地应用于天气动力、物理海洋等数值计算中,其复杂的矩阵计算产生巨大工作量,成为业务化应用过程中的计算瓶颈。利用OpenMP共享并行技术,将大量计算并行化,实现基于OpenMP的共轭梯度法并行加速,为共轭梯度法的广泛应用提供了新的计算解决方案。  相似文献   

6.
一种改进的STL文件快速分层算法   总被引:3,自引:0,他引:3  
高效的STL模型切片算法是快速成型制造的前提和基础,在有向加权图切片算法的基础上提出了一种快速STL模型切片分层算法,去除了耗时的有向加权图建立,对切片后的数据进行后处理,除去数据中的冗余点,从而提供了一种快速的STL模型切片算法。大量实验及数据表明,新算法具有较高的效率。  相似文献   

7.
8.
基于STL文件的快速分层算法的研究   总被引:1,自引:0,他引:1  
为了提高STL文件的分层速度,提出了一种快速分层算法:创建能够表示顶点和边的拓扑信息的数据结构,根据顶点的Z坐标建立顶点的顺序表,并将以各个顶点为起点的边分别组成链表。该算法去掉了顶点的冗余信息,节约了存储空间;因为分层时判断边与分层平面相交情况可以按照排序后的顶点依次进行,所以减少了求交点时的比较次数;顶点不需要分组,从而有效地提高了分层效率。  相似文献   

9.
基于分区和分层搜索的并行粒子群算法*   总被引:1,自引:0,他引:1  
为提高粒子群优化算法在优化问题中的效率,提出了并行粒子群优化算法(SLPSO)。其基本思想是并行机制+解空间压缩+分层搜索。主要工作包括:搜索空间划分为n个区,由n个子群并行搜索,将搜索结果最好的作为指定的搜索空间,即将搜索空间缩小到原解空间的(1/n);提出了粒子群两层划分模型,底层利于扩大搜索范围,上层利于全局精细搜索。在四个基准函数上的优化实验表明,新方法比经典的IPPSO并行粒子群算法在解的精度上提高了80.37%。  相似文献   

10.
采用加矩形窗的积累互相关法和基于Fourier变换频域移位性质的最小熵法进行一维距离像包络对齐。针对包络对齐算法数据量大、复杂度高、运行时间长等缺点,提出一种应用于多核处理器的包络对齐并行算法。该方法利用OpenMP编译指导指令#pragma omp section和#pragma omp for对积累互相关算法和最小熵算法进行多线程并行优化。理论分析和仿真实验表明,该方法大大提升了算法的执行效率。  相似文献   

11.
阐述MPI与OpenMP进行并行计算的特点,并在Visual Studio 2010上构建一个基于两者的混合编程平台。程序在该平台上执行时能够同时实现多进程与进程内多线程编程,设计并实现一种基于数据划分的矩阵乘法的并行算法,将数据分解为两部分交给两个计算节点分别完成,并在每个计算节点内将数据进一步划分,交给多个线程同时执行。通过与非并行矩阵乘法、MPI矩阵乘法、OpenMP矩阵乘法运算性能进行比较,验证该算法可以有效地挖掘计算机的处理能力。  相似文献   

12.
基于混合包围体的OpenMP并行化碰撞检测算法   总被引:1,自引:0,他引:1  
赵伟  谭睿璞  李文辉 《软件学报》2008,19(Z1):190-201
针对交互式系统中碰撞检测实时性、精确性的要求,提出了一种共享存储系统的并行碰撞检测算法.利用AABB包围盒较好的紧密性和包围球计算简单的优点来构建物体的混合包围体层次(S-AABB),快速排除不相交的物体以加速算法,利用OpenMP并行模型来并行遍历混合包围体层次,进一步加速碰撞检测算法.实验结果表明,与现有经典的I-COLLIDE等算法相比,该算法在效率、精确性方面具有明显优势,能够满足交互式复杂虚拟环境的实时性和精确性的要求.同时,还与已经提出的MPI及Pipelining等并行算法进行比较,从时间效率和资源消耗两个方面说明本文基于OpenMP算法的优点.  相似文献   

13.
通常,OpenMP程序开发将开发过程、程序正确性检测和性能分析分离开来.为此,提出动态并行区的概念,并在此基础上提出一种新的OpenMP程序开发模式,将OpenMP程序的开发过程、正确性检测和性能分析紧密地联系起来.在OpenMP程序开发的每一阶段,都能确保程序的正确性;同时,通过精确的性能分析与细微的性能调整,使得OpenMP程序的性能随开发的不断深入而逐步得到改进.据此开发的NPB2.3 OpenMP Fortran版的实测结果显示出该模式的可行性.  相似文献   

14.
考虑到实现确定学习理论中的动态模式识别过程耗时过多,提出一种适用于识别过程计算的多核并行技术。以压气机Mansoux模型为研究背景,首先对其模式获取和识别的过程进行简单描述,其次,在四核PC的硬件平台上,使用OpenMP编程,实现了对动态模式识别的并行计算。通过设置不同的线程数,讨论了几个影响并行程序性能的重要因素。结果表明,要综合考虑各种因素的影响才能设计出高效的并行识别程序。  相似文献   

15.
Selective laser melting (SLM) is one of the most popular additive manufacturing (AM) technologies for metal parts. Slicing result, especially for the different dimensional slicing geometry and its topology, plays an important role because of the thermodynamic behavior of metal powders. To get correct geometry and reliable topology, a slicing strategy for SLM is proposed. The unavoidable numerical error caused by sampling and geometric transformation is suppressed firstly, according to shifting the z-coordinate of a vertex with a small value such the shifted vertex is on a slicing plane. The result of vertex-shifting makes it possible to identify different geometric features such as skin surfaces, overhang surfaces, extreme edges and volumetric solid. Second, from geometric primitives a hierarchy of axis-aligned bounding boxes (AABBs) is constructed and used to speed up intersection of slicing planes against sets of triangles. All intersecting segments are given different signs to depict their geometric or topological information. Based the different signs, the different dimensional geometry that is eventually represented by simple and anticlockwise oriented polygons, are identified. Finally, the polygons are classified and nested in a multi-tree data structure set to produce correct topological relations. The result of digital and physical experiments shows the proposed slicing strategy is feasible and robust.  相似文献   

16.
为有效监控红外弱小目标运动的全过程,必须采用多个波段同时探测,但是多波段探测必然带来计算时间的大幅增长,无法满足实际应用中对目标检测实时性的要求。针对这一问题,本文提出一种基于MPI+OpenMP的层次化并行方法,充分利用消息传递模型和共享存储模型的优势,并基于多处理器节点集群进行测试。实验结果表明,该并行程序在保证相同的检测概率的情况下加速比达到8.61,极大地提高了目标检测的效率。  相似文献   

17.
阐述OpenMP的特点与使用方法,分析合成孔径雷达距离多普勒成像算法,得到该算法中适合利用OpenMP并行处理的部分:傅里叶变换和逆傅里叶变换,并将OpenMP应用到傅里叶变换和逆傅里叶变换中。将原雷达距离多普勒成像算法,设计成可并行化执行的程序。采用pragma omp for和pragma omp section两种并行设计方法,通过创建多个线程,缩短程序执行时间。实验证明,采用双核处理器并行化的雷达成像算法,图像生成时间缩短到原来时间的67%左右,可有效地提高处理效率,充分挖掘处理器的处理能力。  相似文献   

18.
普通Kriging方法是进行空间降水插值的一种有效方法。然而一方面由于海量数据插值计算量大,另一方面该算法的时间复杂度大,为减少空间降水插值的计算时间,采用OpenMP和MPI混合并行技术,实现Kriging并行算法。在Windows操作系统上搭建并行计算环境,实验数据表明,该并行算法能有效地节省计算时间。  相似文献   

19.
一种利用并行复算实现的OpenMP 容错机制   总被引:1,自引:0,他引:1  
富弘毅  丁滟  宋伟  杨学军 《软件学报》2012,23(2):411-427
基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对OpenMP并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持PR-OMP的编译工具GiFT-OMP,并通过实验证明了PR-OMP机制及其支持工具的有效性,评估并分析了其性能和可扩展性.  相似文献   

20.
吴俊杰  杨学军  刘光辉  唐玉华 《软件学报》2010,21(12):3011-3028
将经典的数据重用理论扩充到并行领域,分别提出了面向OpenMP和OpenTM应用的并行数据重用理论.针对重用在线程、事务中的关系,系统地讨论了并行应用中重用的分类、判定和求解方法.同时,应用这一理论研究了OpenTM循环的优化技术,以降低事务被回退的风险.最后,使用并行数据重用理论分析和统计了SPEComp2001中的数据重用.并行数据重用理论可以用于指导面向多核存储共享结构的并行程序分析和编译优化技术研究.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号