首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 968 毫秒
1.
根据国产申威异构众核处理器架构特点,提出了一种结构有限元模态分层通信并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下重大装备系统级模态分析的并行效率具有重要意义.该方法在分层通信策略和加速子空间迭代法的基础上构建了大规模模态分析并行计算体系,不仅实现了计算过程和数据通信的分层,有效提高了通信效率;而且实现了...  相似文献   

2.
根据国产申威异构众核分布式存储计算机的体系结构特点,提出了一种结构瞬态有限元分层并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下大型、超大型复杂结构系统的瞬态并行求解效率具有重要意义。该方法在分层通信和Newmark-HHT算法的基础上构建了大规模复杂结构系统的瞬态并行求解体系,不仅实现了计算过程中大量数据的分布式存储,显著改善了数据的内存访存效率;而且实现了计算过程的两层并行,有效改善了通信效率。因此,该计算方法能够充分利用国产申威异构众核分布式存储并行计算机的体系结构特点提升结构瞬态大规模并行计算效率。最后通过典型数值算例验证了该方法的正确性和有效性,并将其应用于某高层建筑,实现其上千万自由度、数万核的结构瞬态并行计算。  相似文献   

3.
大规模有限元模态分析在一些重大装备研制过程中有迫切需求,对于实现装置系统级分析具有重要意义。基于隐式重启动Arnoldi、Krylov-Schur和Jacobi-Davidson三种主流算法和PANDA并行计算框架,构建了大规模模态分析并行计算体系;将并行求解体系应用于某光机主体结构,实现了其上千万自由度、数千核的模态分析并行计算;结合算例对三种主流算法的适应性和并行可扩展性进行了评估。研究结果表明,基于三种算法构建的并行求解体系均可在1小时内求解千万自由度量级的大规模模态分析问题,并行可扩展性非常优异。  相似文献   

4.
在参数化LogP模型(PLogP模型)的基础上,针对异构多核并行系统通用核和加速核的异构性、存储的层次化、并行执行的层次化特征,提出了新的层次化计算模型Hm-PlogP.该模型对异构多核并行系统的通信和访存进行了抽象,采用向量化参数表达并行系统不同层次的特征,能够预测加速核的执行开销并以此指导并行程序的设计和优化.实验...  相似文献   

5.
接触问题的MPI+OpenMP混合并行计算   总被引:1,自引:0,他引:1  
针对接触计算问题中需要大量全局通信的特点,结合当前流行的多处理器集群系统,采用了MPI+OpenMP的混合并行模式,实现了接触问题的并行计算。以双重区域剖分并行算法为基础,内力计算部分在采用MPI并行基础上,使用基于分块结构的OpenMP并行编程,使得接触力并行计算中涉及的全局通信时间无需增加,从而进一步提高了并行效率。数值模拟实验表明,这种并行方式能在上百处理器上实现千万自由度接触问题的并行计算。  相似文献   

6.
杆系DEM(离散元,discrete element method)是求解结构强非线性问题的有效方法,但随着结构数值计算规模的扩大,杆系DEM所需要的计算时间也随之急剧膨胀。为了提高杆系DEM的计算效率,该研究提出单元级并行、节点级并行的计算方法,基于CPU-GPU异构平台,建构了杆系DEM并行计算框架,编制了相应的几何非线性计算程序,实现了杆系DEM的GPU多线程并行计算。对杆系DEM并行算法的设计主要包括数据存储方式、GPU线程计算模式、节点物理量集成方式以及数据传输优化。最后采用大型三维框架、球壳结构模型分别验证了杆系DEM并行算法的计算精度,并对杆系DEM并行算法进行了计算性能测试,测试结果表明杆系DEM并行算法加速比最高可达12.7倍。  相似文献   

7.
针对土体-结构非线性耦合(Soil-Structure Interaction,SSI)系统动力响应数值模拟带来的大规模计算量问题,提出基于SSI负载均衡及对偶图理论两种区域分解算法的并行计算方法。结合传统的贪婪法及递归坐标对分方法,对这四种方法的并行性能进行研究。SSI采用基于对称罚函数的方法处理,系统方程采用显式中心差分有限元方法求解。对典型的SSI工程问题动力响应进行并行数值模拟,并对这四种方法的可扩展性进行分析。结果表明:基于SSI负载均衡的并行计算方法,充分考虑土体和结构耦合负载的均衡,并行效率最优,基于对偶图理论区域分解的方法和递归坐标对分方法效率次之,贪婪法并行效率最低;随核数增加,并行效率下降,需根据实际模型规模合理选择并行计算核数,获得最优的并行计算效益;基于罚函数的显式有限元方法能够较好的解决SSI动力响应问题。  相似文献   

8.
宽带RAM模型在对称多处理器集群上的并行设计   总被引:1,自引:0,他引:1       下载免费PDF全文
为了提高声场模型的计算效率以满足当前水声研究对声场计算速度的要求,针对对称多处理器集群系统多节点并且节点内存在多个处理器的特点,利用共享存储模型OpenMP和消息传递编程模型MPI(Message Passing Inter-face)对声学计算模型RAM(Range-dependent Acoustic Model)进行并行编程,构建了并行计算平台,实现了RAM模型在对称多处理器集群系统上节点间和节点内两级并行,并通过实验对该平台的性能进行了测试。实验结果表明,RAM模型适用于并行计算,该并行计算方法具有很高的并行效率,可以大幅度提高声场计算速度。  相似文献   

9.
利用模态综合法技术结合并行机特点提出一个求解复杂系统动响应的模态综合法。该方法可不必求整体模态,而利用子结构连接条件直接确定各子结构的动响应,算例表明该方法是有效的,并且具有较高的并行效率  相似文献   

10.
田刚  卢风顺 《硅谷》2011,(17):118-119
GPU具有优秀的浮点计算性能以及很高的存储带宽,是组建异构机群的首选加速处理器。在分析异构高性能机群典型体系结构的基础上,详细描述如何搭建CPU/GPU异构并行计算环境,并提出相应的程序设计框架。以国际上公认的并行程序测试集NPB为例,验证所提出的程序设计框架的有效性。  相似文献   

11.
三维有限元并行EBE方法   总被引:6,自引:1,他引:6  
采用Jacobi预处理,推导了基于EBE方法的预处理共轭梯度算法,给出了有限元EBE方法在分布存储并行机上的计算过程,可以实现整个三维有限元计算过程的并行化。编制了三维有限元求解的PFEM(ParallelFiniteElementMethod)程序,并在网络机群系统上实现。采用矩形截面悬臂梁的算例,对PFEM程序进行了数值测试,对串行计算和并行计算的效率进行了分析,最后将PFEM程序应用于二滩拱坝-地基系统的三维有限元数值计算中。结果表明,三维有限元EBE算法在求解过程中不需要集成整体刚度矩阵,有效地减少了对内存的需求,具有很好的并行性,可以有效地进行三维复杂结构的大规模数值分析。  相似文献   

12.
对Jacobi-Davidson(J-D)算法进行了改进和并行计算研究。通过添加谱变换、收缩和重启动等策略将J-D算法改造成了适应大规模模态分析的算法。利用改进后的算法和各种数值求解软件包,建立了一套基于PANDA框架的模态分析并行求解体系。基于该求解体系和并行机群,开展了某工程结构大规模模态分析并行可扩展性研究,测试规模从数十万自由度一直达到千万自由度,并行CPU核数达到128个;研究了改进后的J-D算法内层迭代步数、重启动向量个数等控制参数对外层迭代收敛速度的影响;获取了不同规模并行计算的加速比。研究结果表明,改进后的J-D算法完全适应千万自由度规模以上的模态分析,内存占用与规模之间呈线性增长趋势,在1 025万自由度规模模态分析仅占用39.4 GB内存;同时该算法具有优异的并行可扩展性,在128个CPU测试核内接近线性加速,并且测试规模越大,曲线越接近理想加速曲线,1 025万自由度规模在128核的并行效率达到88.1 %。  相似文献   

13.
针对基于单机的多点源高斯大气污染扩散模型计算效率较低的问题,设计了高斯模型并行算法,该算法是基于计算输出层设计的,它将计算输出层尽量平均地分配到各个计算节点上。针对并行算法,构建了分布式并行计算平台。该平台采用三层分布式体系结构,即用户层、控制层和计算资源层。实验结果表明,基于该算法的高斯并行计算大大提高了模型计算效率,分布系统结构合理,可以为准实时甚至实时的环境管理业务提供支持。  相似文献   

14.
目前有限元分析软件多基于中央处理器的平台方式构建,在处理复杂高层结构非线性响应分析时暴露出计算耗时多、计算效率低以及对计算硬件要求高等问题。图形处理器由于其硬件构造的先天优势,可以提供十倍乃至上百倍于中央处理器的浮点运算和并行计算性能,因而为高层结构非线性计算所面临的瓶颈问题提供了一个切实可行的解决方法。该文在构建异构并行计算平台的基础上,提出一种适用于图形处理器加速的有限元并行数值计算方法。该方法利用精细化结构分析模型的自由度数据和图形处理器中的线程建立一一对应映射关系,对动力响应的隐式积分算法进行图形处理器线程级的并行化处理,并且结合EBE单元级的优化存储空间机制,降低系统方程组求解时对内存空间的需求。通过对比振动台试验结果对该方法进行验证,并对实际高层钢筋混凝土框筒结构工程进行弹塑性地震响应分析,结果显示该文所提方法在保证模型精度前提下能有效提高大型复杂高层结构非线性响应分析效率。  相似文献   

15.
在保证精度的条件下,为了提高航空发动机模态分析的计算效率,针对传统混合界面子结构模态综合法由于综合后还可能存在计算量大的问题,提出一种改进的混合界面子结构模态综合法。该方法将综合后的模型进一步减缩,同时在减缩过程中引入位移和力的双协调条件,保证了计算的准确性。采用该方法建立了叶片-轮盘的组合结构的参数化模型,对各个子结构建立有限元模型并综合求其模态,与整体结构有限元法相比,计算时间缩短了23.86%~35.74%,模态偏差不大于0.57%,而传统法,其计算时间缩短了14.63%~29.20%,模态偏差不超过0.49%,可见,在相同的工作环境且保证精度的条件下,该方法计算效率比传统混合界面子结构模态综合法有显著提高,尤其是在高阶模态求解时,计算效率提高的更加明显,为下一步的振动响应及组合结构的动态特性研究奠定了基础。  相似文献   

16.
本文采用改进的自由界面模态综合法计算汽轮机叶片组的固有振动。对于一个多子结构系统的联接,讨论了自由度减缩后的子结构运动方程和界面位移协调方程的拼装规则。分别用有限元结构分析程序SAPV和模态综合法计算了形状简单的叶片组模型的振动。算例表明,用模态综合法计算叶片组的振动是一个十分有效的方法,它精确度高,可以大大节省机时。文章最后计算了工业汽轮机组H~255的首级叶片叶片组的振动特性。  相似文献   

17.
为了解决传统的串行有限元分析方法计算耗时多精度低的问题,基于GPU并行计算能力在CUDA架构下建立了一套兼顾精度和效率的高层结构有限元分析的CPU-CPU的异构平台。基于CPU-GPU异构平台研究了高层结构地震响应算法,将整个时间步积分在GPU中计算完成,每一时间步下利用基于GPU的预处理共轭梯度迭代法求解线性方程组获得该时刻的位移,最终实现了基于GPU的Newmark-β法。通过算例验证了本文所提方法的高精度、高效率。  相似文献   

18.
雷霆  姚振汉  王海涛 《工程力学》2006,23(11):28-32,57
以三维弹性力学问题为例,对快速多极与常规边界元法机群并行计算进行了比较。其中常规边界元法求解方程采用高斯消去法,通过调用标准并行求解函数库ScaLAPACK实现;快速多极边界元法并行计算程序采用ANSIC++语言、调用MPI并行通信库自行编写。两种程序均运行于同一机群并行环境。数值算例表明,在同样的机群条件下,采用快速多极边界元法可使解题规模有数量级的提高,计算速度明显高于常规边界元法,并行效率也优于常规边界元法。  相似文献   

19.
针对多品种小批量车间作业型企业的工艺计划和生产计划的整体优化,提出了支持功能集成的多级并行分布式CAPP和PPC集成的体系结构,给出了一种基于集成平台的系统实现方法和产品层原型系统的具体实现。  相似文献   

20.
在研究了分布式虚拟地理环境系统的特征和基于Web Service、GI Web Service实现分布式虚拟地理环境系统的优势的基础上,建立了基于Web Service的分布式虚拟地理环境系统的体系结构,最后开展了原型系统试验.结果证明,系统实现了在异构环境下的资源共享和协同工作,基本解决了以往C/S、B/S结构的系统中共享资源只能集中存储在服务器端等难点问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号