首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行运算架构。而FDTD正演算法本身在算法特性上满足并行的要求,二者的结合将极大地加速程序的计算速度。在基于标准Marmousi速度模型的正演模拟中,程序速度提升30倍,而GPU正演图像与CPU正演结果误差小于千分之一。算例表明CUDA可以大大加速目前的FDTD正演算法,并且随着GPU硬件自身的发展和计算架构的不断改进,加速效果还将进一步提升,这将有利于后续波形反演工作的进展。  相似文献   

2.
星图配准是星图处理应用中的一个重要步骤,因此星图配准的速度直接影响了星图处理的整体速度.近几年来,图形处理器(GPU)在通用计算领域得到快速的发展.结合GPU在通用计算领域的优势与星图配准面临的处理速度的问题,研究了基于GPU加速处理星图配准的算法.在已有配准算法的基础上,根据算法特点提出了相应的GPU并行设计模型,利用CUDA编程语言进行仿真实验.实验结果表明:相较于传统基于CPU的配准算法,基于GPU的并行设计模型同样达到了配准要求,且配准速度的加速比达到29.043倍.  相似文献   

3.
协议特征识别技术中用到了一种重要的LCS算法,它是一种字符串比对算法,提取出字符串中的最长连续公共子串。然而,通过理论分析和实验表明:这个查找过程是一个时间复杂度较高的运算过程,如果输入的数据分组比较大,那么运行的时间将会非常长,为此不得不控制输入数据分组的大小和数量,这严重限制了所采用样本集的大小。提出了基于GPU对LCS运算实现加速的方法。在此基础上搭建和配置了CUDA平台,在此平台下研究并实现了LCS算法的并行性。通过对LCS算法在CUDA下并行性的研究,有效地加快了LCS算法的运行速度。实验结果表明,GPU下LCS算法的运行效率比CPU有了显著的提高。  相似文献   

4.
基于CUDA的H.264去方块滤波的设计与实现   总被引:1,自引:1,他引:0  
详细分析了统一计算设备架构(CUDA)的编程模型,从并行计算角度对H.264视频编解码中的去方块滤波进行研究和优化,提出了基于CUDA加速的去方块滤波并行处理方法.通过对高清测试序列的实验表明,利用GPU并行处理能力能够明显提高视频编解码速度,并有效降低CPU资源占用率.  相似文献   

5.
随着GPU技术的快速发展,GPU的浮点运算能力飞速提升。将GPU浮点处理能力用于非图形计算领域正成为高性能计算领域的热点研究问题。Jacobi迭代法是科学计算中常用的计算方法。在分析了GPU和Jacobi迭代法特征的基础上,基于Nvidia的CUDA平台设计并实现了Jacobi迭代算法,并通过实验表明,相对于CPU取得了较好的加速效果。  相似文献   

6.
生物序列分析由于其数据的海量性、分析算法的多样性和复杂性,因此其对运算平台以及软件工具有着很高的要求。在生物序列分析领域中,文中针对序列比对所采用的经典算法即Smith-Waterman算法在FPGA加速平台下的性能进行研究,利用开放运算语言OpenCL进行异构平台的硬件加速设计。通过利用Smith-Waterman算法的波前特性,在硬件设计层面上实现算法在运算过程中的高度并行化,弥补了在CPU单一平台下只能进行串行运算的不足。通过对大量不同样本序列的测试表明,利用算法的波前特性,针对短序列比对,FPGA的运算速度最高能达到CPU的4倍。  相似文献   

7.
定位型振动光纤探测主机输出的是一个巨大的传感器阵列信号,数据量大且实时性处理要求高,对数据处理提出了很高的要求。本文立足于定位型光纤周界安防系统,基于英伟达公司(NVIDIA)的统一计算设备架构(CUDA)平台对预处理算法进行图像处理器(GPU)加速。结果表明预处理算法运行在GPU上可以达到很好的加速效果,对系统的实时性能有明显提升。  相似文献   

8.
文中实现了GPU平台加速的BWA-MEM算法,将BWA-MEM算法中的两个热点模块:SMEM查找和chain生成模块利用GPU平台进行加速,通过重构算法流程、精简需要向CUDA设备传输的数据结构,采用合理的任务划分方式来提升BWA-MEM在GPU平台的性能。论文对BWA-MEM算法的特点进行了深入分析,总结了BWA-MEM算法在GPU平台加速效果受到限制的原因。  相似文献   

9.
商凯  胡艳 《电子技术》2011,38(5):9-11
近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU开发方式的束缚,把GPU巨大的通用计算能力解放了出来.本文利用GPU来加速AES算法,即利用GPU作为CPU的协处理器,将AES算法在GPU上实现,以提高计算的吞吐量.最后在GPU和CPU...  相似文献   

10.
基于GPU的人脸检测和特征点定位研究   总被引:1,自引:0,他引:1  
人脸分析相关应用越来越广泛,但随着高清视频影像的广泛使用,传统的基于CPU设计实现的程序已难以满足时效性要求。本文基于GPU平台实现了人脸检测和特征点定位的并行化。首先为了加速人脸检测过程,使用Nvidia的CUDA计算范式,通过"窗口级并行"和"分类器级并行"两步实现基于Haar特征的Adaboost算法;然后在人脸检测的基础上,提出一种在常量时间内获得初始模型的方法,并行实现ASM算法。与OpenCV中基于CPU的方法相比,基于GPU的本方法有一定速率提升。  相似文献   

11.
王瑞  梁华  蔡宣平 《现代电子技术》2010,33(15):41-43,46
传统SIFT算法的优化和实现都是针对常用处理器(CPU)提出的,处理速度慢,实时性很难得到保证。通过实现基于NVIDIA公司CUDA架构图形处理器(GPU)的SIFT特征提取算法,优化了数据存储结构,提高了数据访问效率。实验结果表明,基于GPU的SIFT特征提取算法充分利用GPU的并行处理能力,计算速度提高幅度明显,图像越大越复杂,提高的幅度越大,处理1600×1200图像时甚至可达近15倍的加速比,极大地提高了SIFT算法在实际应用中的实时性。  相似文献   

12.
利用CUDA实现的基于GPU的SAR成像算法   总被引:2,自引:0,他引:2  
高速发展的图形处理器(Graphics Processing Unit,GPU)为高效合成孔径雷达(Synthetic Aperture Radar,SAR)成像算法提供了具有发展前景的新型运算平台。与CPU相比,利用GPU进行通用计算具有成本低、性能高的特点。提出利用CUDA实现的基于GPU的SAR成像算法,与传统的基于CPU的成像算法相比,有两位数以上的效率提升,为应对SAR信号处理领域新的挑战提供具有前景的研究方向。  相似文献   

13.
针对连续波雷达中事后分析系统的运算数据量大,运算时间长的特点,提出了一种利用CUDA平台的GPU进行加速运算的方法,它利用GPU的并行运算功能来完成FFT算法。实验结果表明,相比以往用CPU进行事后分析,利用CUDA平台进行事后分析的速度有明显提升。  相似文献   

14.
遥感图像融合技术是有效利用多传感器、多平台、多光谱、多时相遥感数据的主要途径.针对经典的主成分分析(PCA)融合串行算法,提出一种新的基于CPU/GPU异构系统的并行PCA融合算法.实验结果表明,基于CPU/GPU异构系统CUDA架构的并行PCA融合算法充分利用GPU的并行处理能力,计算速度提高幅度明显,图像越大越复杂,提高的幅度越大,处理4096×4096图像数据时,最高能获得将近134倍的加速速率,极大的提高了PCA融合算法在实际应用中的实时性.  相似文献   

15.
相关干涉仪算法具有实现简单和精度高等优点,但将其运用于宽带测向时存在运算量较大等问题,文中针对该问题提出一种基于GPU的宽带干涉仪测向算法实现,利用CUDA技术对传统相关算法进行改进,使之能够适应于GPU平台并充分发挥图形处理器强大的浮点运算能力及其出色的并行执行性,进而使算法在执行速度上能获得极大提升。算法中采用向量1范数并通过插值拟合得到来波方向的精确估计,仿真结果表明,算法在满足实时性要求的同时也能够保证较高精度。相比于CPU平台,算法的GPU实现能够获得很高的时间加速比。  相似文献   

16.
为了提高光照不均图像的增强速率,提出了基于GPU平台的同态滤波并行算法.根据同态滤波算法的并行性,利用CUDA软硬件体系架构,实现了同态滤波算法向GPU上的移植.利用多幅不同分辨率图像作为测试数据,对比CPU和GPU方案的计算效率.实验结果表明,GPU实现方案大幅度提升了计算效率.  相似文献   

17.
高效实现恒虚警概率检测(CFAR)是新型雷达终端信号处理系统研制的重要部分。在基于图形处理器(GPU)的软件化雷达终端架构下,采用统一计算设备架构(CUDA)技术,并根据GPU的特点对算法实现进行优化,实现了高效的软件化CFAR算法,相比CPU软件实现大大缩短了数据处理时间,能够满足雷达信号处理对实时性的需求,同时验证了研发基于GPU的软件化雷达终端具有较高的可行性。  相似文献   

18.
基于GPU的快速二维沃尔什变换研究   总被引:1,自引:1,他引:1  
提出了一种基于GPU(Graphics Processing Unit,图形处理器)CUDA(Compute Unified Device Architecture,计算统一设备架构)平台的快速二维沃尔什变换(Walsh Transform)实现方法.该方法利用GPU的并行结构和硬件特点,从算法实现、存储类型、逻辑构架设置等方面提高了沃尔什变换的运算速度.实验结果表明,随着图像分辨率的增加,沃尔什变换在GPU上运行时间远低于CPU,GPU比CPU具有更明显的加速效果.  相似文献   

19.
针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可采用的并行加速方法,同时结合SIFT的特点提出了并行优化加速的方案。采用基于数据划分的并行方法对遥感图像的几何校正和SIFT特征提取算法进行加速。最后利用CUDA环境,在CPU+GPU异构系统下,设计试验对两个算法优化并行提速,试验结果表明,提出的加速方案和优化算法能大幅提高遥感图像的前期处理效率。  相似文献   

20.
快速互信息匹配及GPU实现   总被引:1,自引:1,他引:0  
针对模板匹配中速度和精度不能兼顾的问题,提出了一种基于GPU的互信息配准方法。为了算法不至于太复杂而不能在GPU下运行,首先将图像二值化,使得GPU每个线程用到的临时变量减少到4个,然后利用GPU逐像素计算模板和焊缝图像的互信息。将所提算法应用到焊缝定位系统中,通过GPU来执行简化后的互信息计算,基于CUDA的实验表明,所提出的算法可以完成每秒约30帧的图像焊缝定位。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号