首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
按照区域分解算法"分而治之"的思想,研究了在普通PC机群上实现大规模并行有限元计算的方法.针对PC机群的特点,有限元计算数据采用分布式存储策略,方程组的求解采用并行预处理共轭梯度算法.采用C 语言及MPI消息传递接口开发了基于PC机群的并行有限元计算程序,利用6台计算机对247 871个单元的有限元模型进行了并行求解,并行加速比达到5.26.验证了程序的可靠性和高效性.  相似文献   

2.
区域分解并行有限元计算方法研究   总被引:1,自引:0,他引:1  
按照区域分解算法“分而治之”的思想,研究了在普通PC机群上实现大规模并行有限元计算的方法.针对PC机群的特点,有限元计算数据采用分布式存储策略,方程组的求解采用并行预处理共轭梯度算法.采用C++语言及MPI消息传递接口开发了基于PC机群的并行有限元计算程序,利用6台计算机对247871个单元的有限元模型进行了并行求解,并行加速比达到5.26.验证了程序的可靠性和高效性.  相似文献   

3.
许多大规模计算程序包含了不规则问题。但在面向分布存储的自动并行化中,以往的研究较难在编译时划分不规则问题的循环和数组。本文提出了一种划分方法来自动为一类常见的不规则问题寻找计算和数据分解,能在编译时通过计算分解分配不规则数组的数据空间,并根据规则数组之间的相关性来减少数组重分布。该方法通过计算分解和数组引用的访问表达式来分配不规则数组访问的数据到各处理器,并通过数组重分布图来在循环间寻找一致的分解。实验结果表明了方法的有效性,并对测试用例取得了预期的加速比。  相似文献   

4.
为解决矩量法在计算电大目标电磁特性时受计算机物理内存限制的问题,设计了一种核外自适应交叉近似算法.使用自适应交叉近似算法有效地压缩了阻抗矩阵,降低了所需存储空间和计算量;并结合核外技术,进一步节省了内存空间,提升了单台计算机的计算能力.通过算例检验了文中方法的准确性和有效性,结果表明:该方法有效地降低了求解电大目标雷达散射截面所需的内存和计算量,并且自适应交叉近似算法及核外计算不损失矩量法的计算精度.  相似文献   

5.
综述了在结构高性能计算中的并行有限元方法的研究现状,其中包括利用普通微机构建的并行计算集群(通常称为Beowulf系统),对该领域的未来发展趋势作了展望;指出了在未来结构高性能计算中,网络并行计算集群环境下的并行有限元方法必定成为一种重要的必不可少的方法。  相似文献   

6.
将思维进化计算(Mind Evolutionary Computation,EC)的并行性和并行计算机的高速性相结合提出了基于MPI的主从式并行MEC.分析了该并行算法的任务分配、通信开销、子群体尺寸、个体评价时间和处理器数目对并行加速比的影响.  相似文献   

7.
一种基于本体的并行网络流量分类方法   总被引:1,自引:0,他引:1  
海量网络流量数据的处理与单一节点的计算能力瓶颈这一矛盾导致数据分类效率低,无法满足现实需求。为解决这一问题,结合本体与MapReduce技术各自在海量异构数据描述与处理方面的优势,提出一种基于本体的并行网络流量分类方法。该方法基于MapReduce并行计算架构,根据网络流量本体结构,对网络流量本体并行化构建;通过并行知识推理完成基于流量统计特征的网络流量分类。实验结果表明,集群环境下基于MapReduce的网络流量本体构建效率明显高于单机环境,而且适当增加计算节点使得加速比线性提升;并行知识推理的分类方法能够有效地提高大规模网络流量的分类效率。  相似文献   

8.
针对多核计算环境下气象计算的并行化这个难题,在分析气象计算并行化步骤的基础上,从气象计算方法间并行,程序模块间并行和程序模块内并行3个角度描述了气象研究程序的一般并行化过程。并以一个气象研究模式为例,分析了其并行化的过程。在模拟实验中,对广泛应用于气象计算的蒙特卡洛方法进行了并行化。实验结果表明,所提出的方法能减少约20%的执行时间。  相似文献   

9.
针对并行计算机不同的数据存储方式,分析对比了基于多核和众核体系结构的共享存储并行编程模型和分布式存储并行编程模型,以CUDA和OpenCL为例介绍了基于异构计算机系统的并行编程模型,指出基于异构平台的混合编程在今后的大规模并行应用中必将成为主流。  相似文献   

10.
针对在线参数辨识计算工作量大,造成难以实时给出参数估值的问题,利用Hopfield型网络的快速优化计算能力,通过对Hopfield网络改进,推出了一种全并行递推神经网络参数辨识方法,使计算量较传统的参数辨识方法大大减小。同时由于神经网络的互连作用,增强了辨识的鲁棒性,为实时给出参数估值提供了可靠的保障。  相似文献   

11.
1INTRODUCTION Withthedevelopmentofcomputertechnolo gies,dataprocessing,transferringandstoringareadvancedgreatly.ButtheperformanceofI/Osub systemisnotimprovedaccordingly.SotheI/Osubsystembecomesabottleneckofthehighper formancecomputing[13].Theeffectivemethodofsolvingtheproblemreliesonsoftware,thatis,tostoreandaccessdatainparallelI/Oacrossmulti nodesofclusterintermsofsomefileallocatingstrategies[4].TheprofessionalpracticeprovesthatparallelI/Oisaneffectivemethodtoeliminatethebottleneck.T…  相似文献   

12.
提出并行计算熵的概念以及基于并行计算熵的同构集群负载均衡算法.理论分析证明并行计算熵作为系统负载均衡程度度量的合理性.算法以并行计算熵来衡量集群系统中节点之间负载均衡程度,以节点任务运算量来衡量节点的负载信息,并根据并行计算熵来进行负载迁移决策.实验证明相对基于任务数阈值的负载均衡算法并行计算性能有一定提高.  相似文献   

13.
14.
To achieve the across-nodes technology of the heterogeneous parallel method of moments (MoM), a parallel MoM programming model is studied on CPU/GPU and CPU/MIC heterogeneous platforms. By utilizing the CONTEXT technology in the CUDA which contains the GPU common programming criterions, and the concept of environment variables in MIC, a general heterogeneous parallel programming model for the CPU/GPU and CPU/MIC is proposed, which meets the static load-balancing for the across-nodes heterogeneous parallel MoM. Numerical results show that the heterogeneous parallel MoM codes based on the proposed parallel programming model can obtain ideal speedup and good scalability.  相似文献   

15.
为解决当前原型学习算法在大规模、大类别机器学习和模式识别领域的计算密集瓶颈问题,提出一种采用GPU和CPU异构并行计算架构的可扩展原型学习算法框架.一是通过分解和重组算法的计算任务,将密集的计算负载转移到GPU上,而CPU只需进行少量的流程控制.二是根据任务类型自适应地决定是采用分块策略还是并行归约策略来实现.采用大规模手写汉字样本库验证本框架,在消费级显卡GTX680上使用小批量处理模式进行模型学习时,最高可得到194倍的加速比,升级到GTX980显卡,加速比可提升到638倍;算法甚至在更难以加速的随机梯度下降模式下,也至少能获得30倍的加速比.该算法框架在保证识别精度的前提下具有很高的可扩展性,能够有效解决原有原型学习的计算瓶颈问题.  相似文献   

16.
分析了平面钢闸门的工作特点,研究和建立了平面钢闸门的精细组合有限元计算模型并进行了并行计算。提出了并行求解策略;采用循环分解技术来实现单元刚度矩阵生成的并行化,采用预处理共轭梯度法并行求解系统方程组。获得了较高的并行计算效率和合理的计算结果,明显减小了结构计算时间。  相似文献   

17.
借助分割数据技术优化了经典的Apriori算法,实现了对候选项集的分组统计。给出了优化Apriori算法的MapReduce编程实现模型,达到了Apriori算法并行化的目的。实验结果表明,该算法能够大量减少键/值对的产生,提高了算法的效率,并且随着挖掘频繁项目集节点数的增加,算法的加速比成线性提高。  相似文献   

18.
19.
一个基于MPI网络并行计算的图形函数库   总被引:1,自引:1,他引:0  
简述了面积工作站群机系统的并行虚拟处理平台MPI及其编程要点,介绍了基于MPI开发的图形函数库,最后以计算机辅助曲线/曲面设计中常用的追赶法为例,详细说明了针对工作站群机系统设计的并行算法。  相似文献   

20.
四维弹簧模型(Four-Dimensional Lattice Spring Model,4D-LSM)是一种考虑额外维相互作用的新型离散数值计算方法。该方法用于岩石破坏分析需要消耗大量计算资源,不适合在普通个人电脑上运行。基于多核并行技术,在阿里云和多核工作站等多种硬件环境下对4D-LSM的计算极限性能及瓶颈进行详细分析,主要研究了求解规模、求解类型、线程数、硬件配置等对4D-LSM求解效能的影响。研究发现,内存容量决定可计算的模型规模,弹性问题的计算时间与模型规模成正比,并行计算效率受CPU性能和内存带宽的共同影响。在不考虑经济因素的情况下,云计算在多核匹配和内存分配方面的灵活性特别适合于四维弹簧模型的并行计算分析。结果表明:基于阿里云的4D-LSM最大运算规模可以达到十亿单元,由于目前的瓶颈在于前后处理,4D-LSM目前的可分析规模仍然限制在两千万单元。最后,展示了采用极限规模的并行四维弹簧模型求解三维币形裂纹扩展的实际应用案例。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号