首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
以曲面轮为基础发展的高精度曲面建模方法(HASM)可以建立具有高精度的数字高程模型,但使用该方法需要求解偏微分方程离散产生的大规模线性方程组,计算量巨大,严重制约了对大规模数据的模拟应用;而现代GPU技术的发展使GPU越来越广泛地应用于通用计算加速。为了提高HASM方法的模拟速度,把高精度曲面模拟与GPU通用技术相结合,提出了GPU加速的高精度曲面建模方法。把HASM模拟过程中的有限差分离散、离散后的大规模线性系统求解分别使用GPU进行分解,使用共轭梯度(CG)和预处理共轭梯度方法(PCG)将求解任务分解为可以并行处理的独立的多任务,使得计算任务并行化,同时并行运行大规模线程,每个线程执行一个独立的任务,充分利用了现代GPU强大的通用计算能力,并行处理以获得加速。利用并行化加速的高精度曲面建模算法使用英伟达公司的统一计算开发架构(CUDA)编程实现,GPU采用该公司的Quadro 2000。分别应用该算法进行了数值实验和实际项目区数字高程模型(DEM)模拟实验。实验结果表明,充分利用GPU的并行处理能力加速后的HASM方法,在保证达到相同曲面模拟的精度条件下,和传统的CPU方法相比,算法可以获得超过一个数量级的加速。  相似文献   

2.
近年来,统一计算设备架构(CUDA)的提出和图形处理器(GPU)快速提升的并行处理能力和数据传输能力,使得基于CUDA的GPU通用计算迅速成为一个研究热点。针对含有大规模分子动力学模拟的热力学量提取效率低下的问题,提出了分子动力学模拟的热力学量提取的新方法,利用CUDA设计了并行算法,实现了利用GPU加速分子动力学模拟的热力学量提取。实验结果表明,与基于CPU的算法相比, GPU可以提高速度500倍左右。  相似文献   

3.
贺毅辉  叶晨  刘志忠  彭伟 《计算机应用》2012,32(9):2466-2469
群体仿真中个体从环境中查找相关对象时会导致较高的时间复杂度。要使大规模群体能够实时仿真,必须降低模型运算的时间复杂度或者提高计算平台的能力。通过对Biods模型为典型案例进行研究,提出一种基于统一计算架构(CUDA)的大规模群体行为实时仿真并行实现及优化的方法。实现中将个体与GPU逻辑线程一一对应,通过将仿真环境离散化来提高相关个体查找的效率,通过并行化基数排序法将个体信息组织成具有空间局部性的数组,提高图形处理器(GPU)内存带宽的利用率。通过实验验证了该方法将仿真个体的数量提升到CPU方法的约7.3倍。  相似文献   

4.
基于CUDA的并行布谷鸟搜索算法设计与实现   总被引:1,自引:0,他引:1  
布谷鸟搜索(cuckoo search,CS)算法是近几年发展起来的智能元启发式算法,已经被成功应用于多种优化问题中。针对CS算法在求解大数据、大规模复杂问题时,计算时间过长的问题,提出了一种基于统一计算设备架构(compute unified device architecture,CUDA)的并行布谷鸟搜索算法。该算法的并行实现采用任务并行与数据并行相结合的方式,利用图形处理器(graphic processing unit,GPU)线程块与线程分别映射布谷鸟个体与个体的每一维数据,并行实现CS算法中的鸟巢位置更新、个体适应度评估、鸟巢重建、寻找最优个体操作。整个CS算法的寻优迭代过程完全通过GPU实现,降低了算法计算过程中CPU与GPU的通信开销。对4个经典基准测试函数进行了仿真实验,结果表明,相比标准CS算法,基于CUDA架构的并行CS算法在求解收敛性一致的前提下,在求解速度上获得了高达110倍的计算加速比。  相似文献   

5.
介绍了一种基于GPU(可编程图形处理单元)的快速实时光线投射算法。为满足大规模体数据集的绘制要求,利用当前GPU的新特性,直接将体数据作为纹理载入显存,采用预积分分类方法在GPU中对体数据进行重采样和分类,避免了计算机主内存与GPU纹理内存之间数据交换的瓶颈问题;利用硬件支持的三维纹理和片元着色器,实时计算每个体素的梯度,实现高质量的光照,保证高质量的图像绘制效果。实验结果表明该方法在医学三维数据场可视化中,能够实时、高效地生成高质量的交互式体可视化图像。  相似文献   

6.
刘明  徐飞  刘玉 《微计算机信息》2008,24(15):293-295
本文通过有效利用图形硬件图形处理单元(GPU)的运算能力和编程性,将大量计算从CPU中分离出来,实现了自然逼真而且高效的大规模波动草叶的实时渲染.利用GPU的顶点程序进行草叶的运动计算,利用GPU的片元程序进行静态阴影的计算.本文技术由OpenGL结合Cg编程实现,达到了自然逼真的渲染效果和较高的渲染效率.  相似文献   

7.
徐伟  王建  杨新 《计算机工程》2013,(11):19-23,30
在心肌灌注核磁共振(MR)图像中,病人的呼吸和心跳会使心脏的位置和形状发生改变,因此需要对心脏核磁共振(CMR)时间序列图像中的心肌图像位置进行运动补偿。针对医学图像特征较少的问题,利用马尔科夫随机场(MRF)模型,提出一种基于图像配准的心脏运动补偿算法。根据心动周期不同时间点图像像素块的邻域和灰度信息,计算心脏的运动向量,将最相似的像素块平移到图像的相近位置,对心跳产生的位移进行补偿。由于MRF模型的计算量较大,将CPU算法和GPU算法相结合,计算耗时部分使用GPU并行实现,以提高程序的运行速度。实验结果表明,该方法能有效地对心肌灌注MR图像中心脏的位移和弹性形变进行补偿,结合GPU算法能使运动补偿算法的计算性能提高400%,图像配准时间仅为CPU算法的1/3。  相似文献   

8.
基于GPU的大规模海浪实时绘制   总被引:1,自引:0,他引:1  
海浪建模与绘制是近二十年来计算机图形学领域的一个经典问题,同时,随着硬件的发展,尤其是图形处理器(GPU)以大大超过摩尔定律的速度高速发展和其高速计算能力、并行性、其可编程功能,使得基于GPU的通用计算成为一个新研究热点.利用GPU的高速计算能力和可编程功能,解决海浪模拟中的复杂计算问题,提出一种基于图形硬件的大规模海浪实时绘制方法.首先,对图形处理器进行了概述.然后,基于Gerstner-Rankine模型生成海洋高度场,采用屏幕细分自适应算法对数字地球上的可视海洋表面进行采样,利用图形处理单元的可编程特性进行顶点和颜色计算,模拟实时球面海浪效果.实验结果表明,基于GPU的方法可以在普通PC图形硬件上实现大规模海浪的交互漫游.  相似文献   

9.
流体模拟是计算机图形学中一个重要课题。使用基于粒子的光滑流体动力学SPH(smoothed particle hydrodynamics)方法模拟大规模流体的运动需要大量的粒子模拟流体,计算量巨大,传统的方法很难达到实时性要求。为了解决该问题,使用NVIDIA的并行计算架构CUDA(Compute Unified Device Architecture)将SPH方法的全部处理过程在GPU上实现,充分利用了GPU并行计算的性能优势。使用Z-order排列改进已有的并行邻域搜索算法,并通过优化数据结构及存储器分配,有效缓解了SPH方法在GPU架构上的性能瓶颈。实验结果表明,该方法能实时逼真地模拟大规模流体,与已有的GPU方法相比处理速度有显著的提升。  相似文献   

10.
基于场景结合的大规模动态群体可见性计算方法   总被引:1,自引:1,他引:0  
动态场景的可见性计算对于大规模场景的实时渲染具有重要意义,其中运动中的大规模群体更给可见性计算带来了很大的开销.针对大规模动态群体在建筑物场景内部运动的情况,提出一种与场景结合的动态群体可见性计算方法.在预处理时,根据个体在不同仿真时刻的位置,将其绑定到相应的场景节点中;在实时绘制时,结合场景的可见性判断结果对动态群体中的个体进行可见性判断.实验结果表明,该方法能高效地剔除动态群体中的不可见个体,使大规模动态场景的实时绘制效率得到明显提高.  相似文献   

11.
李攀  彭伟 《计算机应用研究》2012,29(3):1166-1168
基于中央处理器(CPU)串行的人群疏散传统方法对于人群规模较少的场景,可以得到良好的疏散模拟效果,但在人群密度较高的场景中,难以达到实时模拟的要求。为了克服上述问题,实现了一种基于图形处理器(GPU)的人群疏散模拟的方法。该方法通过对个体寻径算法的优化,不仅能使个体快速准确地智能寻径,而且将个体寻径独立性与图形处理器高性能计算特性进行结合,充分利用了图形处理器强大的并行计算能力,从而大幅度提高了人群疏散模拟的人群规模,使人群疏散模拟的实时性得到增强。  相似文献   

12.
树突对大脑神经元实现不同的信息处理功能有着重要作用。精细神经元模型是一种对神经元树突以及离子通道的信息处理过程进行精细建模的模型,可以帮助科学家在实验条件的限制之外探索树突信息处理的特性。由精细神经元组成的精细神经网络模型可通过仿真对大脑的信息处理过程进行模拟,对于理解树突的信息处理机制、大脑神经网络功能背后的计算机理具有重要作用。然而,精细神经网络仿真需要进行大量计算,如何对精细神经网络进行高效仿真是一个具有挑战的研究问题。本文对精细神经网络仿真方法进行梳理,介绍了现有主流仿真平台与核心仿真算法,以及可进一步提升仿真效率的高效仿真方法。将具有代表性的高效仿真方法按照发展历程以及核心思路分为网络尺度并行方法、神经元尺度并行方法以及基于GPU(graphics processing unit)的并行仿真方法3类。对各类方法的核心思路进行总结,并对各类方法中代表性工作的细节进行分析介绍。随后对各类方法所具有的优劣势进行分析对比,对一些经典方法进行总结。最后根据高效仿真方法的发展趋势,对未来研究工作进行展望。  相似文献   

13.
文章提出一种基于混沌和比特级置乱的并行图像加密算法--CBLP算法。该算法主要包含3种基本运算:像素位置置换、比特旋转(BR)以及像素值异或(XOR)运算,其中位置置换用于置乱像素位置,BR和XOR运算用于扩散图像的像素值。另外,为充分利用当前异构处理平台的计算资源以大幅提升算法的执行效率,文章在NIVIDIA GeForce GTX 580 GPU上使用OpenCL技术并行实现了该算法。实验结果和数值分析表明,CBLP算法具有较高的加密效率和良好的安全性,可以有效地应用于实际加密当中,具有较高的应用价值。  相似文献   

14.
针对舰船目标红外仿真的需求,对红外仿真的流程及关键技术进行了研究。论文简要介绍了一种基于海洋背景下的舰船及其尾迹的红外仿真方案。利用将物理信息模型与几何模型绑定的方法,充分运用GPU的着色器技术实现红外辐射并行实时计算,有效提高了红外场景生成的实时性。论文将温度场的实时计算放入GPU 中,可实时实现由温度变化引起的目标辐射能量的变化。同时,论文提出一种尾迹建模方法,提高了整个场景的真实性。红外仿真结果尚能令人满意,为红外成像的仿真及演示提供了一种有效的手段。  相似文献   

15.
In this paper, we articulate a novel plastic phase-field (PPF) method that can tightly couple the phase-field with plastic treatment to efficiently simulate ductile fracture with GPU optimization. At the theoretical level of physically-based modeling and simulation, our PPF approach assumes the fracture sensitivity of the material increases with the plastic strain accumulation. As a result, we first develop a hardening-related fracture toughness function towards phase-field evolution. Second, we follow the associative flow rule and adopt a novel degraded von Mises yield criterion. In this way, we establish the tight coupling of the phase-field and plastic treatment, with which our PPF method can present distinct elastoplasticity, necking, and fracture characteristics during ductile fracture simulation. At the numerical level towards GPU optimization, we further devise an advanced parallel framework, which takes the full advantages of hierarchical architecture. Our strategy dramatically enhances the computational efficiency of preprocessing and phase-field evolution for our PPF with the material point method (MPM). Based on our extensive experiments on a variety of benchmarks, our novel method's performance gain can reach 1.56× speedup of the primary GPU MPM. Finally, our comprehensive simulation results have confirmed that this new PPF method can efficiently and realistically simulate complex ductile fracture phenomena in 3D interactive graphics and animation.  相似文献   

16.
在现实动画中,固体、液体和颗粒材料结合上力学性质是对算法设计的重要挑战。提出一种考虑到粒子之间的摩擦力的PCISPH方法,即F-PCISPH,用于模拟固体颗粒材料。颗粒在运动的过程中,除了受到压力、重力、粘力等外力外,颗粒与颗粒之间还存在不可忽略的摩擦力。在确定压力之后计算摩擦力,计算其对粒子流加速度产生的影响,并提出临界密度概念来判断粒子流密度是否小于临界密度,以保证颗粒材料能顺利流动。实验证明F-PCISPH方法和原PCISPH方法同等渲染效率下,程序效果更加逼真。  相似文献   

17.
针对基于离散元方法的海冰与海洋平台结构碰撞分析系统,对运行于CPU GPU异构高性能计算平台上的大规模粒子模拟进行可视化方法的研究.使用OpenGL完成不同规模的平整冰、浮冰、冰脊和不规则形态海冰的呈现,不同形状海洋平台结构与受力网格的绘制,海冰粒子的运动轨迹与速度的表达,海浪效果的模拟以及碰撞过程的动画演示等.通过定义合理的交互模式与接口,在一定程度上融合GPU加速的离散元计算与后处理显示,基于多进程管道通信、多线程并行输出等实现在GPU加速计算的同时实时显示粒子模拟计算结果.该方法在帮助研究者随时掌握程序执行状况的同时,大幅减少后续传输、处理和存储的数据.  相似文献   

18.
This paper presents an effective scheme for clustering a huge data set using a PC cluster system, in which each PC is equipped with a commodity programmable graphics processing unit (GPU). The proposed scheme is devised to achieve three-level hierarchical parallel processing of massive data clustering. The divide-and-conquer approach to parallel data clustering is employed to perform the coarse-grain parallel processing by multiple PCs with a message passing mechanism. By taking advantage of the GPU’s parallel processing capability, moreover, the proposed scheme can exploit two types of the fine-grain data parallelism at the different levels in the nearest neighbor search, which is the most computationally-intensive part of the data-clustering process. The performance of our scheme is discussed in comparison with that of the implementation entirely running on CPU. Experimental results clearly show that the proposed hierarchial parallel processing can remarkably accelerate the data clustering task. Especially, GPU co-processing is quite effective to improve the computational efficiency of parallel data clustering on a PC cluster. Although data-transfer from GPU to CPU is generally costly, acceleration by GPU co-processing is significant to save the total execution time of data-clustering.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号