共查询到20条相似文献,搜索用时 968 毫秒
1.
2.
根据国产申威异构众核分布式存储计算机的体系结构特点,提出了一种结构瞬态有限元分层并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下大型、超大型复杂结构系统的瞬态并行求解效率具有重要意义。该方法在分层通信和Newmark-HHT算法的基础上构建了大规模复杂结构系统的瞬态并行求解体系,不仅实现了计算过程中大量数据的分布式存储,显著改善了数据的内存访存效率;而且实现了计算过程的两层并行,有效改善了通信效率。因此,该计算方法能够充分利用国产申威异构众核分布式存储并行计算机的体系结构特点提升结构瞬态大规模并行计算效率。最后通过典型数值算例验证了该方法的正确性和有效性,并将其应用于某高层建筑,实现其上千万自由度、数万核的结构瞬态并行计算。 相似文献
3.
4.
5.
接触问题的MPI+OpenMP混合并行计算 总被引:1,自引:0,他引:1
针对接触计算问题中需要大量全局通信的特点,结合当前流行的多处理器集群系统,采用了MPI+OpenMP的混合并行模式,实现了接触问题的并行计算。以双重区域剖分并行算法为基础,内力计算部分在采用MPI并行基础上,使用基于分块结构的OpenMP并行编程,使得接触力并行计算中涉及的全局通信时间无需增加,从而进一步提高了并行效率。数值模拟实验表明,这种并行方式能在上百处理器上实现千万自由度接触问题的并行计算。 相似文献
6.
杆系DEM(离散元,discrete element method)是求解结构强非线性问题的有效方法,但随着结构数值计算规模的扩大,杆系DEM所需要的计算时间也随之急剧膨胀。为了提高杆系DEM的计算效率,该研究提出单元级并行、节点级并行的计算方法,基于CPU-GPU异构平台,建构了杆系DEM并行计算框架,编制了相应的几何非线性计算程序,实现了杆系DEM的GPU多线程并行计算。对杆系DEM并行算法的设计主要包括数据存储方式、GPU线程计算模式、节点物理量集成方式以及数据传输优化。最后采用大型三维框架、球壳结构模型分别验证了杆系DEM并行算法的计算精度,并对杆系DEM并行算法进行了计算性能测试,测试结果表明杆系DEM并行算法加速比最高可达12.7倍。 相似文献
7.
《振动与冲击》2016,(24)
针对土体-结构非线性耦合(Soil-Structure Interaction,SSI)系统动力响应数值模拟带来的大规模计算量问题,提出基于SSI负载均衡及对偶图理论两种区域分解算法的并行计算方法。结合传统的贪婪法及递归坐标对分方法,对这四种方法的并行性能进行研究。SSI采用基于对称罚函数的方法处理,系统方程采用显式中心差分有限元方法求解。对典型的SSI工程问题动力响应进行并行数值模拟,并对这四种方法的可扩展性进行分析。结果表明:基于SSI负载均衡的并行计算方法,充分考虑土体和结构耦合负载的均衡,并行效率最优,基于对偶图理论区域分解的方法和递归坐标对分方法效率次之,贪婪法并行效率最低;随核数增加,并行效率下降,需根据实际模型规模合理选择并行计算核数,获得最优的并行计算效益;基于罚函数的显式有限元方法能够较好的解决SSI动力响应问题。 相似文献
8.
为了提高声场模型的计算效率以满足当前水声研究对声场计算速度的要求,针对对称多处理器集群系统多节点并且节点内存在多个处理器的特点,利用共享存储模型OpenMP和消息传递编程模型MPI(Message Passing Inter-face)对声学计算模型RAM(Range-dependent Acoustic Model)进行并行编程,构建了并行计算平台,实现了RAM模型在对称多处理器集群系统上节点间和节点内两级并行,并通过实验对该平台的性能进行了测试。实验结果表明,RAM模型适用于并行计算,该并行计算方法具有很高的并行效率,可以大幅度提高声场计算速度。 相似文献
9.
利用模态综合法技术结合并行机特点提出一个求解复杂系统动响应的模态综合法。该方法可不必求整体模态,而利用子结构连接条件直接确定各子结构的动响应,算例表明该方法是有效的,并且具有较高的并行效率 相似文献
10.
GPU具有优秀的浮点计算性能以及很高的存储带宽,是组建异构机群的首选加速处理器。在分析异构高性能机群典型体系结构的基础上,详细描述如何搭建CPU/GPU异构并行计算环境,并提出相应的程序设计框架。以国际上公认的并行程序测试集NPB为例,验证所提出的程序设计框架的有效性。 相似文献
11.
三维有限元并行EBE方法 总被引:6,自引:1,他引:6
采用Jacobi预处理,推导了基于EBE方法的预处理共轭梯度算法,给出了有限元EBE方法在分布存储并行机上的计算过程,可以实现整个三维有限元计算过程的并行化。编制了三维有限元求解的PFEM(ParallelFiniteElementMethod)程序,并在网络机群系统上实现。采用矩形截面悬臂梁的算例,对PFEM程序进行了数值测试,对串行计算和并行计算的效率进行了分析,最后将PFEM程序应用于二滩拱坝-地基系统的三维有限元数值计算中。结果表明,三维有限元EBE算法在求解过程中不需要集成整体刚度矩阵,有效地减少了对内存的需求,具有很好的并行性,可以有效地进行三维复杂结构的大规模数值分析。 相似文献
12.
对Jacobi-Davidson(J-D)算法进行了改进和并行计算研究。通过添加谱变换、收缩和重启动等策略将J-D算法改造成了适应大规模模态分析的算法。利用改进后的算法和各种数值求解软件包,建立了一套基于PANDA框架的模态分析并行求解体系。基于该求解体系和并行机群,开展了某工程结构大规模模态分析并行可扩展性研究,测试规模从数十万自由度一直达到千万自由度,并行CPU核数达到128个;研究了改进后的J-D算法内层迭代步数、重启动向量个数等控制参数对外层迭代收敛速度的影响;获取了不同规模并行计算的加速比。研究结果表明,改进后的J-D算法完全适应千万自由度规模以上的模态分析,内存占用与规模之间呈线性增长趋势,在1 025万自由度规模模态分析仅占用39.4 GB内存;同时该算法具有优异的并行可扩展性,在128个CPU测试核内接近线性加速,并且测试规模越大,曲线越接近理想加速曲线,1 025万自由度规模在128核的并行效率达到88.1 %。 相似文献
13.
14.
目前有限元分析软件多基于中央处理器的平台方式构建,在处理复杂高层结构非线性响应分析时暴露出计算耗时多、计算效率低以及对计算硬件要求高等问题。图形处理器由于其硬件构造的先天优势,可以提供十倍乃至上百倍于中央处理器的浮点运算和并行计算性能,因而为高层结构非线性计算所面临的瓶颈问题提供了一个切实可行的解决方法。该文在构建异构并行计算平台的基础上,提出一种适用于图形处理器加速的有限元并行数值计算方法。该方法利用精细化结构分析模型的自由度数据和图形处理器中的线程建立一一对应映射关系,对动力响应的隐式积分算法进行图形处理器线程级的并行化处理,并且结合EBE单元级的优化存储空间机制,降低系统方程组求解时对内存空间的需求。通过对比振动台试验结果对该方法进行验证,并对实际高层钢筋混凝土框筒结构工程进行弹塑性地震响应分析,结果显示该文所提方法在保证模型精度前提下能有效提高大型复杂高层结构非线性响应分析效率。 相似文献
15.
在保证精度的条件下,为了提高航空发动机模态分析的计算效率,针对传统混合界面子结构模态综合法由于综合后还可能存在计算量大的问题,提出一种改进的混合界面子结构模态综合法。该方法将综合后的模型进一步减缩,同时在减缩过程中引入位移和力的双协调条件,保证了计算的准确性。采用该方法建立了叶片-轮盘的组合结构的参数化模型,对各个子结构建立有限元模型并综合求其模态,与整体结构有限元法相比,计算时间缩短了23.86%~35.74%,模态偏差不大于0.57%,而传统法,其计算时间缩短了14.63%~29.20%,模态偏差不超过0.49%,可见,在相同的工作环境且保证精度的条件下,该方法计算效率比传统混合界面子结构模态综合法有显著提高,尤其是在高阶模态求解时,计算效率提高的更加明显,为下一步的振动响应及组合结构的动态特性研究奠定了基础。 相似文献
16.
17.
18.
19.
针对多品种小批量车间作业型企业的工艺计划和生产计划的整体优化,提出了支持功能集成的多级并行分布式CAPP和PPC集成的体系结构,给出了一种基于集成平台的系统实现方法和产品层原型系统的具体实现。 相似文献