首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
红外弱小目标的探测与跟踪对运算硬件和算法的性能提出较高的要求。针对传统背景预测算法串行运算耗时较长的问题,以及经典的通用GPU(Graphic Processing Unit)体积与功耗过大难于整合到红外设备中的问题,提出在嵌入式GPU平台NVIDIA Jetson TK1中实现并行分离卷积的方法,利用CUDA(Compute Unified Device Architecture)实时执行背景预测算法,实现了在嵌入式GPU平台上高效的红外背景预测算法。实验结果表明,在保证正确预测背景的前提下,利用小体积、低功耗的嵌入式GPU平台可以将运算性能提高到串行运算的15倍以上。  相似文献   

2.
为了提高光照不均图像的增强速率,提出了基于GPU平台的同态滤波并行算法.根据同态滤波算法的并行性,利用CUDA软硬件体系架构,实现了同态滤波算法向GPU上的移植.利用多幅不同分辨率图像作为测试数据,对比CPU和GPU方案的计算效率.实验结果表明,GPU实现方案大幅度提升了计算效率.  相似文献   

3.
基于CUDA的DCT快速变换实现方法   总被引:4,自引:2,他引:2  
为了加快DCT快速变换的处理速度,提出了一种基于CUDA在图形处理器(GPU)上实现DCT快速变换的方法,其中主要利用DCT变换中各分块之间的独立性适合GPU并行处理架构的特点,把传统串行DCT快速变换算法映射到CUDA并行编程模型,并从线程分配,内存使用,硬件资源划分等方面进行优化,来充分利用GPU的巨大运算能力,实验表明,该方法能有效地提高D阻快速变换的速度.  相似文献   

4.
文中实现了GPU平台加速的BWA-MEM算法,将BWA-MEM算法中的两个热点模块:SMEM查找和chain生成模块利用GPU平台进行加速,通过重构算法流程、精简需要向CUDA设备传输的数据结构,采用合理的任务划分方式来提升BWA-MEM在GPU平台的性能。论文对BWA-MEM算法的特点进行了深入分析,总结了BWA-MEM算法在GPU平台加速效果受到限制的原因。  相似文献   

5.
董亚清 《电子科技》2013,26(12):12-16
利用NVIDA公司开发的CUDA技术对线性调频信号脉冲压缩算法进行了研究。用CUDA C和C语言分别在GPU、CPU平台对该算法进行仿真,并对程序执行时间做出了比较。实验结果表明,在GPU平台上实现脉冲压缩算法的运算效率明显优于在CPU上。  相似文献   

6.
为了能在PC机上处理大规模数据集问题,提出了使用CUDA架构对LP-SVM的加速实现方法。该方法针对PC机内存小的缺点,对SVM的分解算法进行改编,得到求解LP-SVM的分解算法。LP—SVM分解算法每次只需要求解一个小规模的线性规划问题,避免一次性把所有训练数据都装进内存。同时把求解线性规划中比较耗时的矩阵运算,移植到CUDA上进行,提高了求解效率。实验结果表明:LP—SVM算法在经过CUDA加速以后,算法的执行效率提高了10—35倍。  相似文献   

7.
董蕾  黄方  卜栓栓  冯杰  周纪 《信息技术》2016,(4):32-36,40
压缩感知重构算法存在计算量大、运行时间过长的问题,无法满足人们对算法处理实时/准实时性要求。最近几年,GPU计算能力得到很大的提升,已成为提高算法处理速度最有效的方式之一。根据GPU的硬件特性,文中提出了基于CUDA的压缩感知重构算法的并行设计。实验结果表明:在NVIDIA K20Xm平台上运行,并行算法取得的加速比可达到100X。  相似文献   

8.
马歌  肖汉 《现代电子技术》2014,(20):103-106
Prewitt算法是数字图像分割中最常用的边缘检测算法。采用传统CPU上的串行方法实现该算法需要较大的计算量、耗时较长,因此,通过GPU对其进行性能加速有着重要的意义。然而由于GPU硬件体系结构的差异性,跨平台移植是一件非常困难的工作。针对上述问题,提出了一种基于OpenCL异构框架的Prewitt图像边缘检测并行算法。实验结果表明,该并行算法比CPU上的串行算法运行速度快,加速比可达30倍,有效地提高了大规模数据处理的效率,可移植性好,具有较高的应用价值。  相似文献   

9.
基于GPU的快速二维沃尔什变换研究   总被引:1,自引:1,他引:1  
提出了一种基于GPU(Graphics Processing Unit,图形处理器)CUDA(Compute Unified Device Architecture,计算统一设备架构)平台的快速二维沃尔什变换(Walsh Transform)实现方法.该方法利用GPU的并行结构和硬件特点,从算法实现、存储类型、逻辑构架设置等方面提高了沃尔什变换的运算速度.实验结果表明,随着图像分辨率的增加,沃尔什变换在GPU上运行时间远低于CPU,GPU比CPU具有更明显的加速效果.  相似文献   

10.
针对连续波雷达中事后分析系统的运算数据量大,运算时间长的特点,提出了一种利用CUDA平台的GPU进行加速运算的方法,它利用GPU的并行运算功能来完成FFT算法。实验结果表明,相比以往用CPU进行事后分析,利用CUDA平台进行事后分析的速度有明显提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号