首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
基于GPU的大规模拓扑优化问题并行计算方法   总被引:1,自引:0,他引:1  
韩琪  蔡勇 《计算机仿真》2015,32(4):221-226,304
针对进行大规模拓扑优化问题计算量庞大且计算效率低的问题,设计并实现了一种基于图形处理器(GPU)的并行拓扑优化方法.采用双向渐进结构拓扑优化(BESO)为基础优化算法,采用一种基于节点计算的共轭梯度求解方法用于有限元方程组求解.通过对原串行算法的研究,并结合GPU的计算特点,实现了迭代过程全流程的并行计算.上述方法的程序设计和编写采用统一计算架构(CUDA),提出了基于单元和基于节点的两种并行策略.编写程序时充分使用CUDA自带的各种数学运算库,保证了程序的稳定性和易用性.数值算例证明,并行计算方法稳定并且高效,在优化结果一致的前提下,采用GTX580显卡可以取得巨大的计算加速比.  相似文献   

2.
图形任务计算的复杂性及实时性要求高速计算。文中提出了一种异构处理器间的图形并行生成方法,在层次分割和多主体协作模式下,各处理器并行运作,一方面有效利用了环境中的计算资源,另一方面提高了各处理器的计算并行度。  相似文献   

3.
随着各个行业的需要,频繁项集挖掘算法需要处理大量的、连续不断的、动态的数据,算法的计算量非常大,为了提高算法的性能,可以使用CPU和GPU的架构,用GPU的并行计算提高算法的性能。  相似文献   

4.
图形处理器在数据管理领域的应用研究综述   总被引:1,自引:0,他引:1       下载免费PDF全文
比较了中央处理器和图形处理器体系结构的异同,并简要介绍了最新的图形处理器通用计算平台及不同体系结构间并行算法的异同。详细叙述了图形处理器在空间数据库、关系数据库、数据流和数据挖掘及信息检索等方面应用的技术特点;探讨了基于图形处理器的各种内外存排序算法及性能;描述了基于图形处理器的各种数据结构和索引技术;阐述了图形处理器算法优化方面的工作。最后,展望了图形处理器应用于数据管理的发展前景,并分析了这一领域未来所面临的挑战。  相似文献   

5.
拓扑优化技术在汽车零部件设计中的应用   总被引:1,自引:0,他引:1  
介绍拓扑优化技术及其在汽车零部件设计中的应用.  相似文献   

6.
何希  吴炎桃  邸臻炜  陈佳 《计算机应用》2019,39(7):2008-2013
形态学重建是医学图像处理中非常基础和重要的操作。它根据掩膜图像的特征对标记图像反复进行膨胀操作,直到标记图像中的像素值不再变化为止。对于传统基于中央处理器(CPU)的形态学重建系统计算效率不高的问题,提出了使用图形处理器(GPU)来加速形态学重建。首先,设计了适合GPU处理的数据结构:并行堆集群;然后,基于并行堆集群,设计和实现了一套基于GPU的形态学重建系统。实验结果表明,相比传统基于CPU的形态学重建系统,基于GPU的形态学重建系统可以获取超过20倍的加速比。基于GPU的形态学重建系统展示了如何把基于复杂数据结构的软件系统高效地移植到GPU上。  相似文献   

7.
为快速得到钢制发动机舱盖的铝合金替代结构设计,引入拓扑优化设计方法进行结构模拟计算和设计。以钢制发动机舱盖内板结构为基础,以保证扭转刚度和降低质量比为优化条件,利用OptiStruct软件进行多次迭代优化,得到相应的铝合金舱盖内板基础结构,为后续的发动机舱盖钣金设计提供参考。  相似文献   

8.
图形处理器在通用计算中的应用   总被引:1,自引:1,他引:0  
基于图形处理器(GPU)的计算统一设备体系结构(compute unified device architecture,CUDA)构架,阐述了GPU用于通用计算的原理和方法.在Geforce8800GT下,完成了矩阵乘法运算实验.实验结果表明,随着矩阵阶数的递增,无论是GPU还是CPU处理,速度都在减慢.数据增加100倍后,GPU上的运算时间仅增加了3.95倍,而CPU的运算时间增加了216.66倍.  相似文献   

9.
随着图形处理器(GPU)从仅用来进行图形图像渲染,脱离成为并行计算平台通用图形处理器(GPGPU),其计算能力越来越强,本文在研究GPGPU体系结构的基础上对GPGPU并行计算线程调度进行深入研究,阐述了GPU线程调度原理,揭示了SIMT调度模式的不足.通过公式推导阐述了系统功耗与系统运行频率的关系.  相似文献   

10.
线程级并行计算在图形渲染引擎中的研究   总被引:1,自引:0,他引:1  
针对并行计算技术在当前图形渲染系统中应用层面较浅的问题,为提高多核平台下图形应用程序CPU利用率,提出了一种新的Fork-Join多线程渲染方案。对当前流行的开源图形渲染引擎——OGRE引擎的渲染框架进行了多线程优化,用OpenMP方法对图形引擎的逻辑帧实现并行化,根据Win32线程库和DirectX11的多线程支持提出了一种渲染帧并行化方法,并将其应用于图形引擎。在多核平台上的实验结果表明,该方案能有效提高渲染速率和CPU利用率,改善CPU负载均衡。  相似文献   

11.
水利计算是水利规划、设计以及运行的基础,提高水利计算的效率对水利信息化和水资源管理具有重要实践意义。通过技术对比发现,GPU(Graphics Processing Unit)并行优化技术是性价比较高的提速策略。系统概述了GPU并行优化技术在水利计算中的应用进展;简要介绍了当前应用较多的几种并行技术;建设性提出了该项技术在水库调度、中长期水文预报和水文模型计算中的应用前景和优势;详细总结了应用该项技术的一般方法,为技术推广提供指导。最后从学科发展和应用需求的角度,有针对性的提出了技术应用难点和今后发展趋势,以期为GPU并行优化技术在水利计算中的应用提供借鉴。  相似文献   

12.
Reliability-based topology optimization   总被引:1,自引:2,他引:1  
The objective of this work is to integrate reliability analysis into topology optimization problems. The new model, in which we introduce reliability constraints into a deterministic topology optimization formulation, is called Reliability-Based Topology Optimization (RBTO). Several applications show the importance of this integration. The application of the RBTO model gives a different topology relative to deterministic topology optimization. We also find that the RBTO model yields structures that are more reliable than those produced by deterministic topology optimization (for the same weight).  相似文献   

13.
A 99 line topology optimization code written in Matlab   总被引:29,自引:5,他引:29  
The paper presents a compact Matlab implementation of a topology optimization code for compliance minimization of statically loaded structures. The total number of Matlab input lines is 99 including optimizer and Finite Element subroutine. The 99 lines are divided into 36 lines for the main program, 12 lines for the Optimality Criteria based optimizer, 16 lines for a mesh-independency filter and 35 lines for the finite element code. In fact, excluding comment lines and lines associated with output and finite element analysis, it is shown that only 49 Matlab input lines are required for solving a well-posed topology optimization problem. By adding three additional lines, the program can solve problems with multiple load cases. The code is intended for educational purposes. The complete Matlab code is given in the Appendix and can be down-loaded from the web-site http://www.topopt.dtu.dk. Received October 22, 1999  相似文献   

14.
基于MPI集群环境对弹塑性区域分解有限元并行计算进行研究。提出了基于三阶和四阶的龙格库塔(Runge-Kutta)方法对应力-应变关系进行积分的算法。积分过程中自动调整子步大小来控制积分过程中的误差。研制了采用最小残余平滑法的子结构预处理共轭梯度并行求解算法。算法在基于工作站机群的并行环境下实现。计算结果表明:该算法具有良好的并行加速比和效率,是一种有效的并行求解算法。  相似文献   

15.
武旭晨  朴春慧  蒋学红 《计算机应用》2019,39(10):3071-3078
针对电动出租车充电站优化选址问题,构建了以未满足的电动出租车充电需求量和新建充电站的固定成本最小为目标函数的电动出租车新建充电站选址模型,并提出基于改进的多目标粒子群算法的模型求解方法。为解决未满足充电需求量计算的性能瓶颈问题,设计了一个基于图形处理器(GPU)的未满足充电需求量并行计算算法,并通过实验验证其运行时间约为基于CPU串行算法运行时间的10%~12%。以北京为例,收集、处理相关多源数据,对提出的选址模型进行了应用示例分析,表明所提出的充电站优化选址方案具有可行性。  相似文献   

16.
硅各向异性腐蚀过程复杂,采用元胞自动机模拟硅各向异性腐蚀非常耗时。为了加速腐蚀模拟过程,研究了基于图形处理器(GPU)进行硅的各向异性腐蚀模拟。针对串行算法直接并行化方法存在加速效率低等问题,提出了一个改进的并行模拟方法。该方法增加了并行部分的负载,减少了内存管理的开销,从而提高了加速性能。实验证明该方法能够获得较理想的加速比。  相似文献   

17.
张硕  何发智  周毅  鄢小虎 《计算机应用》2016,36(12):3274-3279
基于统一计算设备架构(CUDA)对图形处理器(GPU)下的并行粒子群优化(PSO)算法作改进研究。根据CUDA的硬件体系结构特点,可知Block是串行执行的,线程束(Warp)才是流多处理器(SM)调度和执行的基本单位。为了充分利用Block中线程的并行性,提出基于自适应线程束的GPU并行PSO算法:将粒子的维度和线程相对应;利用GPU的Warp级并行,根据维度的不同自适应地将每个粒子与一个或多个Warp相对应;自适应地将一个或多个粒子与每个Block相对应。与已有的粗粒度并行方法(将每个粒子和线程相对应)以及细粒度并行方法(将每个粒子和Block相对应)进行了对比分析,实验结果表明,所提出的并行方法相对前两种并行方法,CPU加速比最多提高了40。  相似文献   

18.
多物理耦合是一类普遍的复杂应用问题。并行计算时,在充分考虑各个物理过程的基础上,还需要在不同物理过程之间建立数据依赖关系并交换物理量值。这无论对并行算法设计,还是对并行编程实现来说,均具有较大的难度。JASMIN框架提供联邦计算功能,很好地封装和实现了单层结构网格上的多物理耦合并行计算。该功能实际应用于激光聚变和地球系统模式等领域,支撑研发了多个应用程序,可以有效使用成千上万个处理器核进行数值模拟。  相似文献   

19.
A model for the computational cost of the finite-difference time-domain (FDTD) method irrespective of implementation details or the application domain is given. The model is used to formalize the problem of optimal distribution of computational load to an arbitrary set of resources across a heterogeneous cluster. We show that the problem can be formulated as a minimax optimization problem and derive analytic lower bounds for the computational cost. The work provides insight into optimal design of FDTD parallel software. Our formulation of the load distribution problem takes simultaneously into account the computational and communication costs. We demonstrate that significant performance gains, as much as 75%, can be achieved by proper load distribution.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号