首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
叠前逆时偏移(RTM)方法是目前地震勘探领域最为精确的一种地震数据成像方法,其运用双程声波方程进行波场延拓,可实现对复杂构造介质的准确成像.文中采用互相关成像条件对震源波场与检波点波场在同时刻相关成像.针对RTM方法计算量大的问题,将图形处理器(GPU)引入到RTM计算中,充分挖掘GPU的众核结构优势,利用基于CUDA架构的并行加速算法取代传统CPU的串行运算,对逆时偏移算法中较为耗时的波场延拓和相关成像过程进行加速.复杂模型测试结果表明,在确保RTM成像精度的前提下,相比于传统CPU计算,GPU并行加速算法可大幅度地提高计算效率,进而实现基于GPU加速的叠前逆时偏移算法对复杂介质的高效率、高精度成像.  相似文献   

2.
在地震资料的处理应用中,逆时偏移等处理技术由于计算资源的需求量巨大,而不能在实际生产中被广泛采用。GPU及CUDA编程架构的引入大幅提高其运算性能,是解决类似技术应用的有效途径。同时,GPU独特的物理特性使得一些应用不仅不能提高性能,甚至使性能急剧下降。通过逆时偏移技术应用实例来说明GPU的加速效果,同时将其和常规流程进行对比和分析给出应用软件的GPU适用性评价方法。  相似文献   

3.
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大提高了在GPU集群中编程的复杂度。主流GPU异构集群系统大多采用针对GPU的异构计算编程模型与面向分布式内存的消息传递模型的简单结合方式,这种方式使得GPU集群程序设计缺乏确定的准则,往往是低效而且易错的。为了提高在GPU集群中编程的效率,降低编程复杂度,以及实现平台无关性,提出一套异构GPU集群的并行分布式编程的解决方案。该方案通过采用扩展语言方法提出了编程框架DISPAR,并实现了预处理器系统StreamCC。实验证明了其可行性。  相似文献   

4.
应用GPU集群加速计算蛋白质分子场   总被引:1,自引:2,他引:1  
针对生物化学计算中采用量子化学理论计算蛋白质分子场所带来的巨大计算量的问题,搭建起一个GPU集群系统,用来加速计算基于量子化学的蛋白质分子场.该系统采用消息传递并行编程环境(MPI)连接集群各结点,以开放多线程OpenMP编程标准作为多核CPU编程环境,以CUDA语言作为GPU编程环境,提出并实现了集群系统结点中GPU和多核CPU协同计算的并行加速架构优化设计.在保持较高计算精度的前提下,结合MPI,OpenMP和CUDA混合编程模式,大大提高了系统的计算性能,并对不同体系和规模的蛋白质分子场模拟进行了计算分析.与相应的CPU集群、GPU单机和CPU单机计算方法对比,该GPU集群大幅度地提高了高分辨率复杂蛋白质分子场模拟的计算效率,比CPU集群的平均计算加速比提高了7.5倍.  相似文献   

5.
近年来GPU作为一种具有极强运算能力的多核处理器,得到了快速的发展,成为高性能计算领域的主要发展方向。各种分子动力学模拟的主流软件也纷纷使用GPU技术,其中LAMMPS较早地开发出了通用的并行GPU版本。本文利用nVIDIA公司最新Femi架构的Tesla C2050 GPU搭建了小型的基于LAMMPS的分子动力学模拟GPU并行计算集群,通过氩原子熔化的算例对集群性能进行了测试,测试的内容包括CPU集群、单节点单GPU、单节点多GPU以及多节点GPU集群。比较了各种情况的加速倍数并对造成性能改变的原因进行了讨论,分析了用于MD模拟的GPU并行计算集群性能的瓶颈所在,提出可能的解决方法,搭建集群时,充分考虑PCI总线的承受能力,对于集群效率的提高有很大好处。测试结果表明,集群的性能较高,相对于以往的单机以及CPU集群,计算的规模大大提高了,加速比也在20倍以上。可以预测,在未来一段时间内,多GPU并行是分子动力学模拟的发展方向。  相似文献   

6.
从单个GPU异构并行系统来看,其性能还是比较有限,文章阐述了基于GPU集群的CUDA架构实现过程,详细分析基于GPU集群进行MD5快速破解的编译过程,并对破解程序进行测试研究,对其运行结果进行测试和分析,探讨搭建GPU高性能计算集群及其进行MD5算法的快速破解的过程。  相似文献   

7.
为提高图像处理领域协方差矩阵的计算效率,满足其在实时要求下的应用,借助GPU通用计算技术,结合CUDA编程模型,对协方差矩阵的计算进行有针对性的并行化优化,设计并实现一种高效的并行图像协方差矩阵算法。为在通用PC平台上使用协方差矩阵并满足实时性需求的各种图像处理应用提供了一个可行的解决方法,对其它领域涉及到协方差矩阵的实时计算也有良好的借鉴作用。与原有的CPU实现方法相比,GPU的效率有了平均数千倍的提升。  相似文献   

8.
针对双向相似性计算在CPU下串行计算效率低下,无法满足实际需求的问题,利用该计算中数据独立性的特点,应用CUDA编程模型实现基于GPU加速的图像双向相似性计算。与CPU相比,在392x300的分辨率实验下,该算法在GPU上可获得超过1200倍的加速比。  相似文献   

9.
GPU计算在油气勘探中应用前景   总被引:1,自引:1,他引:0  
油气勘探数据处理工作涉及大量计算,需要高性能计算技术的扶助,目前流行的PC集群在处理工作中存在一些问题,GPU作为一种辅助计算设备能够配合CPU完成一些密集计算的工作.作为一种新兴的高性能计算技术,GPU编程技术的特点使其更适合于中小规模密集型计算环境,因此需要计算机人员在引进该技术时谨慎考虑配置模式,以GPU/CPU协同工作模式有效提升处理系统计算效率.  相似文献   

10.
基于GPU的并行集群系统的各类产品遍布我国的生产,生活。本文将介绍GPU的并行集群的技术和其在我国的发展状况。  相似文献   

11.
自适应方向提升小波变换(ADL)利用图像纹理特征进行变换编码,从而获得更高的编码质量,但同时也增加了计算复杂度.为了提高图像编码速率,在统一计算设备架构(CUDA)的图形处理器(GPU)上,提出一种并行实现ADL中的插值和方向变换计算的新方案,对插值部分同时采用粗粒度和细粒度的并行,即把图像数据分成若干个块进行粗粒度的并行,而对块中的每个像素点采用细粒度的并行.对变换部分中的9个变换方向采用粗粒度的并行.实验表明,在GPU上并行实现ADL变换是CPU实现的4倍左右,CPU-GPU整体架构下的ADL变换编码的速度是CPU平台下的3倍左右.  相似文献   

12.
Jacobi和Laplace算法在GPU平台上的设计与实现   总被引:1,自引:1,他引:0  
随着半导体工艺的发展,GPU的浮点计算能力迅速提高。如何把GPU处理技术应用到非图形计算领域成为体系结构以及高性能计算领域的热点研究问题。Jacobi和Laplace是科学计算领域常用的计算核心。本文基于AMD的流处理GPU平台设计并实现了这两个算法,相对于CPU平台取得了很好的加速效果。  相似文献   

13.
双向纹理函数的有效压缩与绘制   总被引:1,自引:0,他引:1  
吴向阳  龚怿  彭群生  王毅刚 《计算机学报》2006,29(12):2201-2207
提出了一种有效的BTF压缩方法:对简单BTF样本区域用一个统一的低频函数模拟整个区域的整体光照效果,再对每个像素生成一个高频函数来表现细节;对复杂样本区域则首先进行像素聚类,再在各个像素类内对视线采样方向自适应地聚类,在各个视线类内分别拟合一个低频函数,并求像素在各个视线内的高频函数,利用低频函数与高频函数的和重建了像素在相应视线类内的视觉效果.与局部PCA方法的对比表明,该文的算法取得了较高的压缩效率和更快的绘制速度,能实现交互的软件绘制和实时硬件绘制.  相似文献   

14.
在分析GPU并行计算特点的基础上,提出并实现了基于GPU编程的地形纹理快速渲染方法,其核心是用GPU编程对地形纹理图像进行快速解压.与传统渲染流程不同,该方法首先把压缩纹理图像传输到图形卡中,然后通过GPU编程实现对压缩图像解压的硬件加速,从而解决了海量纹理数据存储;传输带宽以及解压速度等一系列问题.实验结果表明基于GPU编程的地形纹理快速渲染方法在虚拟场景的渲染速度方面优势明显,并且随着地形纹理图像分辨率的增大这种优势体现得更加充分.  相似文献   

15.
适用于GPU的四面体体数据规则化与可视化   总被引:1,自引:0,他引:1  
为实现三维不规则体数据场的高效绘制,提出一种适用于GPU的四面体体数据规则化和可视化算法.将以四面体为基本单元的稀疏体数据用一个有限深度的八叉树结构逼近,并将逼近误差表达为一个离散的完全空间哈希结构;然后将半规则的八叉树转换为规则的八叉树纹理(三维),并将完全空间哈希表转换为三维查找表,两者均可在绘制时快速随机取值,故可直接作为三维纹理在GPU中访问.通过这种双规则化的表示方法,可将四面体体数据的可视化转化为在GPU中并行地绘制2种三维纹理.实验结果表明,该算法在处理空间稀疏体数据时保证了较高的精度,同时减少了数据存储量.  相似文献   

16.
针对光线跟踪方法存在求交计算量大、实时交互性差等缺点.从体光线跟踪算法、基于图形硬件加速的光线跟踪体绘制方法,并行光线跟踪体绘制技术这3个方面,对国内外光线跟踪方法在体绘制中的应用技术进行了分类描述与综述,重点介绍了体光照模型、光线跟踪混合绘制、基于可编程硬件加速、并行绘制算法及体系结构,并结合应用阐述了各自特点及其相互联系,最后对光线跟踪方法在体绘制的应用提出了研究建议.  相似文献   

17.
层次包围盒与GPU实现相结合的光线投射算法   总被引:6,自引:2,他引:6  
针对目前基于GPU的光线投射算法中参数确定复杂的缺点,提出一种快速确定投射光线参数的算法,并利用层次包围盒技术对整个绘制过程进行加速.该算法利用离屏渲染技术,仅通过绘制体数据包围盒表面就能获取投射光线的参数;为了跳过对绘制结果无贡献的空体素,逐层对体数据进行分解,并生成层次包围盒树来存储对应子体数据的相关信息,通过遍历包围盒树,判断对应子体数据是否被绘制或跳过来缩短投射光线在体数据中的有效采样长度,从而实现了光线积分加速.实验结果表明,与同类算法相比,该算法预处理时间较短,在增加存储容量较小的同时获得了平均3.0的加速比,具有更好的实用性.  相似文献   

18.
三维动态云快速模拟的新方法   总被引:2,自引:0,他引:2  
自然景观真实感的模拟是计算机图形学领域中的研究热点和难点之一.尽管人们对静态云的真实感模拟进行了大量的研究,动态云模拟的工作还比较少.动态云的快速模拟技术在计算机游戏动画、飞行视景仿真、影视广告等许多领域具有重要的应用价值.提出了一种三维动态云快速模拟的新方法.首先,在较低分辨率的网格上求解云运动的物理方程,获得动态云的速度场.然后,采用纹理漂移的方法来增加云的表面细节.通过充分利用GPU的加速性能,该算法可以达到较高的绘制速度.最后,对上述算法进一步优化处理,使其可以适用于多种硬件平台.  相似文献   

19.
线性系统求解中迭代算法的GPU加速方法   总被引:1,自引:0,他引:1  
在求解线性系统时,迭代法是一种基本的方法,特别是在系数矩阵为大规模稀疏矩阵的情况下,高效地使用迭代法求解变得十分重要。本文通过分析迭代法的一般特点,提出了使用具有强大计算能力和存储带宽的GPU加速迭代法的一般方法。利用这些方法,在两种主流GPU平台上实现了一个经典的迭代法PQMRCGSTAB,并且针对不同的GPU平台特点提出了具体的优化方法。与AMD Opteron 2.4GHz 4核处理器相比,双精度版本的PQMRCGSTAB算法经NVIDIA Tesla S1070加速后性能提高31倍,经AMD Radeon HD 4870 X2加速后性能提高9倍。  相似文献   

20.
基于GPU的多分辨率体数据重构和渲染   总被引:4,自引:1,他引:3  
基于小波变换的多分辨率压缩算法能够获得很高的压缩比,因而被广泛地用于压缩体数据.针对这种压缩策略,研究基于GPU的数据重构的方法,可以只从CPU向GPU传输少量的压缩数据,从而提高数据传输效率.因为好的数据结构是实现基于GPU的重构算法的关键,所以文中提出适合使用矩形纹理表示的数据结构--Nested Tileboard;然后给出基于该数据结构在GPU上实现多分辨率重构的方法,使用Nested Tileboard保存中间数据及重构结果;还提出了基于Nested Tileboard的多分辨率体绘制方法,直接对重构数据进行体绘制,从而实现数据重构和体绘制的无缝连接.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号