共查询到19条相似文献,搜索用时 46 毫秒
1.
研究了一种基于OpenMP技术的多核架构下并行蚁群算法,通过在TSP问题中的实验表明,该算法易于操作,而且充分利用了多核处理器并行计算的优势,提高了算法的运行效率。 相似文献
2.
简要综述并行计算的思想,并对分布式内存结构和共享式内存结构两种结构的特点进行比较。叙述如何应用OpenMP和MPI进行混合编程,以及相应的混合编程模型。通过一个实例,针对多核CPU组成的SMP构架的集群,实现OpenMP和MPI混合编程的性能对比和结论分析。 相似文献
3.
针对大多数并行Delaunay网格生成算法无法充分利用多核共享内存结构的问题,在原有面向共享内存的二维并行算法基础上,根据三维问题的特点提出基于OpenMP的三维并行Delaunay网格生成算法。算法采用划分求解区域为方格的方法实现候选点集的划分和并行插点。使用OpenMP对算法进行实现,并利用多种实现技术避免线程间的同步等待,提升算法效率。实验结果表明,本文算法及所采用的实现技术可以在三维条件下快速生成大量网格单元,具有较高的并行效率,同时能够保证良好的网格质量。 相似文献
4.
阐述MPI与OpenMP进行并行计算的特点,并在Visual Studio 2010上构建一个基于两者的混合编程平台。程序在该平台上执行时能够同时实现多进程与进程内多线程编程,设计并实现一种基于数据划分的矩阵乘法的并行算法,将数据分解为两部分交给两个计算节点分别完成,并在每个计算节点内将数据进一步划分,交给多个线程同时执行。通过与非并行矩阵乘法、MPI矩阵乘法、OpenMP矩阵乘法运算性能进行比较,验证该算法可以有效地挖掘计算机的处理能力。 相似文献
5.
针对RFID网络规划问题,综合考虑其整体性能,建立约束多目标优化的网络规划模型;提出混合萤火虫多目标优化算法,在算法中引入新的搜索机制和非支配排序方法,以加强其搜索能力,并更有效逼近Pareto前沿。仿真研究表明,所提算法可以有效提高RFID网络的整体性能,即在保证标签覆盖率的同时,提高网络经济效益,降低阅读器冲突,平衡网络负载,实现对RFID网络的优良规划。 相似文献
6.
为了充分利用现有的多核CPU计算资源,提出一种基于OpenMP框架的快速并行分层算法,并对其性能进行讨论.该算法利用模型自然分组特征建立拓扑关系分组,使得模型拓扑数据结构的建立时间缩短;在此基础上,采用基于OpenMP的多线程计算,将拓扑结构的建立过程和求取层片轮廓的过程并行化计算,可以取得接近CPU核数的加速比,因此分层时间明显降低.对于复杂三维模型的超大STL文件进行分层处理,实例计算表明文中算法是一种高效且易于实现的方法. 相似文献
7.
针对交互式系统中碰撞检测实时性、精确性的要求,提出了一种共享存储系统的并行碰撞检测算法.利用AABB包围盒较好的紧密性和包围球计算简单的优点来构建物体的混合包围体层次(S-AABB),快速排除不相交的物体以加速算法,利用OpenMP并行模型来并行遍历混合包围体层次,进一步加速碰撞检测算法.实验结果表明,与现有经典的I-COLLIDE等算法相比,该算法在效率、精确性方面具有明显优势,能够满足交互式复杂虚拟环境的实时性和精确性的要求.同时,还与已经提出的MPI及Pipelining等并行算法进行比较,从时间效率和资源消耗两个方面说明本文基于OpenMP算法的优点. 相似文献
8.
9.
普通Kriging方法是进行空间降水插值的一种有效方法。然而一方面由于海量数据插值计算量大,另一方面该算法的时间复杂度大,为减少空间降水插值的计算时间,采用OpenMP和MPI混合并行技术,实现Kriging并行算法。在Windows操作系统上搭建并行计算环境,实验数据表明,该并行算法能有效地节省计算时间。 相似文献
10.
灰狼优化算法(GWO)是目前一种比较新颖的群智能优化算法,具有收敛速度快,寻优能力强等优点。本文将灰狼优化算法用于求解复杂的作业车间调度问题,与布谷鸟搜索算法进行比较研究,验证了标准GWO算法求解经典作业车间调度问题的可行性和有效性。在此基础上,针对复杂作业车间调度问题难以求解的特点,对标准GWO算法进行改进,通过进化种群动态、反向学习初始化种群,以及最优个体变异等三个方面的改进操作,测试结果表明改进后的混合灰狼优化算法能够有效跳出局部最优值,找到更好的解,并且结果鲁棒性更强。 相似文献
11.
XU Rui HUANG XiaoXue LUO Lin & LI ShaoCai State Key Laboratory of Hydraulics Mountain River Engineering College of Architecture Environment Sichuan University Chengdu China College of Electronic Engineering Guilin University of Electronic Technology Guilin College of Life Sciences 《中国科学:信息科学(英文版)》2010,(1)
This paper presents a new grid-associated algorithm to improve the performance of a D8 algorithm based distributed hydrological model computation.The algorithm is based on the well known single-flow D8 algorithm of grid flow.This algorithm allocates calculation priorities according to the distance between the units and the outlet,then carries out the ergodic computations of the hydrological units according to the priority division.For the parallelized algorithm,a standard thread-level shared memory system f... 相似文献
12.
对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算法.算法研究集中在SMP集群系统环境下的负载平衡、通信开销和性能评价.混合并行算法的设计结合了粗粒度线程并行模式和任务共享的动态调用方法,改善了MPI算法中的负载平衡问题、降低了通信开销.在深腾6800上的实验表明,基于混合并行算法的求解器比纯MPI版本的求解器具有更好的性能和可扩展性. 相似文献
13.
14.
基于OpenMP实现了一种基于空腔交叠互斥准则与无锁原子操作的Delaunay三角化增量插点细粒度并行算法。在串行算法的基础上,对点集引入Hilbert排序,使相邻点在几何上亦相邻。引入互斥机制--仅当各空腔无公共单元及公共相邻边时,才可同时插入,根据Delaunay局部性准则可保证整个网格都具备Delaunay属性。每个单元用一个原子变量标记该单元是否已被占有,在计算Delaunay空腔时,各线程将试图写入该原子变量,但本竞争机制保证有且仅有一个线程能成功获得该单元的所有权,以保证算法的互斥性。经数值实验表明,对于107的点集,该算法在16核下加速比可达7.06倍。 相似文献
15.
16.
LICOM是中国科学院大气物理研究所开发的全球海洋环流模式,广泛应用于海洋研究和气候预测。随着分辨率的提高,LICOM对计算的要求呈几何级数的增长。多核或众核已成为当前主流的高性能计算体系结构,原LICOM程序只使用了MPI并行,无法发挥混合架构的高性能。本文介绍了如何在分析LICOM特征基础之上,应用OpenMP及其它优化手段对LICOM进行MIC移植和并行优化,详细介绍了模式优化的实现过程。并通过数值试验证明了优化前后的计算效果有一定提高。 相似文献
17.
18.
考虑到实现确定学习理论中的动态模式识别过程耗时过多;提出一种适用于识别过程计算的多核并行技术。以压气机Mansoux模型为研究背景;首先对其模式获取和识别的过程进行简单描述;其次;在四核PC的硬件平台上;使用OpenMP编程;实现了对动态模式识别的并行计算。通过设置不同的线程数;讨论了几个影响并行程序性能的重要因素。结果表明;要综合考虑各种因素的影响才能设计出高效的并行识别程序。 相似文献