首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
该文提出一种基于图形处理器(GPU)的距离多普勒成像算法(RDA),为合成孔径声呐(SAS)的实时成像提供了新的途径。通过GPU平台上的并行方法进行距离向脉冲压缩、固定相位补偿和方位向脉冲压缩,显著提升了距离多普勒成像算法效率。仿真和实验结果表明:在满足成像分辨率的前提下,该文设计的基于GPU的并行RDA和CPU串行算法相比,加速比可达到22,满足实时SAS成像需求。  相似文献   

2.
唐斌  龙文 《液晶与显示》2016,31(7):714-720
本文提出一种基于GPU+CPU的快速实现Canny算子的方法。首先将算子分为串行和并行两部分,高斯滤波、梯度幅值和方向计算、非极大值抑制和双阈值处理在GPU中完成,将二维高斯滤波分解为水平方向上和垂直方向上的两次一维滤波从而降低计算的复杂度;然后使用CUDA编程完成多线程并行计算以加快计算速度;最后使用共享存储器隐藏线程访问全局存储的延迟;在CPU中则使用队列FIFO完成边缘连接。仿真测试结果表明:对分辨率为1024×1024的8位图像的处理时间为122 ms,相对应单独使用CPU而言,加速比最高可达5.39倍,因此本文方法充分利用了GPU的并行性的特征和CPU的串行处理能力。  相似文献   

3.
一种基于Sobel分解算子的图像边缘检测并行算法   总被引:4,自引:6,他引:4  
串行Sobel梯度算子边缘检测算法需要将两个掩模S1和S2分别在图像的每个像素上移动.并在每个像素上进行11次加法运算,即需要11xN^2次加法,时间复杂度为O(N^2);文章提出了一种Sobel算子分解模型。并设计了一种在SIMD—MPP模型上基于Sobel分解算子的并行图像边缘检测算法.该并行算法总共只需要8次平移操作和9次加法运算即可完成,其时间复杂度为O(1),加速比达到N^2,大大地提高了基于Sobel算子的图像边缘特征提取的效率。  相似文献   

4.
采用CUDA平台提供的通用并行处理架构,在Gauss-Jordan消去法的基础上,给出了一种适合CUDA平台的并行算法来进行大规模线性方程组的加速求解。算法在GPU端进行整体线性方程组的求解,从Device传回的为方程组的解向量,大大减少了来自Host端和Device端数据传输所带来的延时。算法对任务划分及处理进行了充分的分析。在耗时最为严重的消去阶段,通过增加单个线程的算术逻辑运算来减少线程块之间切换带来的整体算法耗时,并对算法的其余每个阶段都进行了充分的优化。最后在本机上进行了不同线性方程组维数的并行算法与串行算法的加速比,实验结果表明了该并行算法能够充分利用GPU硬件特性,并充分降低了大规模线性方程组的求解时间。  相似文献   

5.
张凌洁  赵英 《电子设计工程》2012,20(17):15-18,22
Floyd-Warshall算法是图论中APSP(All-Pair Shortest Paths)问题的经典算法,为了加快计算速度,提出使用GPU通用计算来实现。文章先从算法的原理入手,层层深入,提出了可以在GPU上运行的并行F-W算法。之后,又根据矩阵分块的原理和GPU共享存储器的使用,实现了改进的GPU并行F-W算法。通过大量测试实验,得到了该GPU并行程序相对于传统CPU并行程序产生超过百倍的加速比的结论。  相似文献   

6.
刘昊 《电子质量》2010,(12):1-4
随着GPU的发展,其计算能力和访存带宽都超过了CPU,在GPU上进行通用计算具有成本低、性能高的特点。细胞神经网络由于其特有的性质,非常适合利用GPU进行并行计算,因此,该文提出了利用CU-DA实现的基于GPU的细胞神经网络异构算法,并应用在图像边缘检测上。实验结果证明,与传统的利用CPU实现的边缘检测方法相比,在速度上,基于GPU实现的图像边缘检测方法提高了数十倍,为细胞神经网络在实时图像、视频处理上的应用提供了新的方法。  相似文献   

7.
分析了KNN算法在GPU上实现并行计算的可能性,提出了通过使用CUDA实现KNN算法的方案,在研究了GPU对存储访问的机制后,通过设计合理的数据以及对算法的改进,避免存储体冲突的产生,提高了算法的健壮性。研究结果证明该方法在GPU上的并行运算速度明显要快于CPU,有着很好的加速比。  相似文献   

8.
遥感图像PCA融合的并行算法研究与实现   总被引:2,自引:0,他引:2  
文章针对已有的遥感图像PCA融合串行算法,提出了一种基于数据并行的新的PCA融合并行算法PPCA.并对该并行算法进行了通信优化,在机群系统上进行了实现。针对IKONOS图像进行实验的结果表明该算法可获得良好的并行加速比.并行效率较高,为遥感图像的实际应用提供了有益的指导和借鉴。  相似文献   

9.
大数据的不断深化应用和信号处理算法的不断迭代升级,推进了雷达目标检测的不断革新,实现对动目标的检测的同时,实时性的保证成了一个问题。目前研究对动目标的检测多在理论和仿真阶段,针对提高实时性的加速处理方法研究较少。本文针对当前普遍的动目标检测算法流程,设计CPU(Central Processing Unit,中央处理器)+ GPU(Graphics Processing Unit,图形处理器)的异构加速,利用GPU的并行处理能力,通过对算法进行并行加速和流水加速处理来替代传统的串行处理方式,实现了高速实时目标检测信号处理,并通过仿真数据验证分析进而证明准确性和实时性。   相似文献   

10.
针对数字全息重建算法计算速度慢、实时应用能力弱以及现有GPU加速策略跨平台移植性差等问题,该文提出一种利用开放运算语言(OpenCL)架构提高数字全息重建算法执行效率的方案。该方案充分利用OpenCL架构的异构协同计算能力,对数字全息卷积重建算法进行CPU+GPU的异构运行设计,并采用数据并行模式编程实现。针对不同分辨率数字全息图、不同GPU加速平台的测试结果表明,该加速策略的平均执行时间均比CPU低1个数量级,最高总加速比达到54.2,并行运算加速比甚至高达94.7,且具有规模增长性及良好的跨平台特性,加速效率显著,更加适用于数字全息技术的工程化实现及实时性应用场合。  相似文献   

11.
星图配准是星图处理应用中的一个重要步骤,因此星图配准的速度直接影响了星图处理的整体速度.近几年来,图形处理器(GPU)在通用计算领域得到快速的发展.结合GPU在通用计算领域的优势与星图配准面临的处理速度的问题,研究了基于GPU加速处理星图配准的算法.在已有配准算法的基础上,根据算法特点提出了相应的GPU并行设计模型,利用CUDA编程语言进行仿真实验.实验结果表明:相较于传统基于CPU的配准算法,基于GPU的并行设计模型同样达到了配准要求,且配准速度的加速比达到29.043倍.  相似文献   

12.
Speeded Up Robust Feature(SURF)算法是在计算机视觉领域得到广泛应用的一种图像兴趣点检测和匹配方法。开放计算语言(OpenCL)提供了一个在异构体系结构上,包括GPU,CPU及其他类型处理器,编写并行程序的框架。本文介绍了如何在通用GPU和OpenCL平台上,对SURF算法进行优化与实现。本文对其中一些优化方法,例如kernel线程的配置,局部内存的使用方法等,进行了详细的对比和讨论。最终实现的OpenCL版本的算法在NVidiaGTX260平台上获得了比原始的CPU版本在IntelDual—CoreE54002.7G处理器上至少21倍的加速。  相似文献   

13.
为快速地去除或减少DSA(Digital Subtraction Angiography)图像的噪声,对比评价KNN(K Nearest Neighbors)算法对高斯噪声、泊松噪声、斑点噪声、椒盐噪声4种噪声去除或减少的效果,帮助医生快速准确地为病人诊断疾病.提出的算法主要贡献在于构建了基于GPU(Graphics Processing Unit)的加速方法,使传统图像去噪的运算速度得到大幅提升.基于图像降质、图像还原过程建模,使用KNN算法对4种噪声去除或减少,并对算法做并行化处理,利用GPU加速实现去噪的过程.通过实验得出,KNN算法能较好地去除或减少高斯噪声、泊松噪声来还原DSA图像,使用CUDA(Compute Unified Device Architecture)编写可在GPU上运行的程序,利用GPU对1 024×1 024像素的24位深度的DSA图像去噪,平均渲染帧率能达到190.53 f/s(帧/秒),较传统CPU(Central Processing Unit)串行,平均处理速度提高70.86倍.使用GPU加速能够快速地处理数据量较大、计算密集的DSA噪声图像,实现有效并且快速的高斯噪声去除,帮助医生精、准、快地诊断疾病.  相似文献   

14.
为了提高光照不均图像的增强速率,提出了基于GPU平台的同态滤波并行算法.根据同态滤波算法的并行性,利用CUDA软硬件体系架构,实现了同态滤波算法向GPU上的移植.利用多幅不同分辨率图像作为测试数据,对比CPU和GPU方案的计算效率.实验结果表明,GPU实现方案大幅度提升了计算效率.  相似文献   

15.
在地基太阳观测中,光线在穿越大气层时会受到大气湍流的影响而导致图像扭曲、变形以致质量下降。为了消除或降 低大气湍流的影响,事后图像处理技术被用来获得高分辨力的太阳图像。基于斑点干涉法和斑点掩模的事后重建算 法可以获得高分辨力的图像,但由于计算复杂度高,难以满足实时性的要求。在讨论了算法原理的基础上, 使用CUDA并行计算架构实现了太阳斑点重建算法并行化。实验结果表明,在GPU环境下,一张TiO通 道2304 pixel$\times$1984 pixel像素大小的图像,可以在70 s内完成重建,相比运行在CPU上的串行程序,加速比可达7以上。  相似文献   

16.
红外弱小目标的探测与跟踪对运算硬件和算法的性能提出较高的要求。针对传统背景预测算法串行运算耗时较长的问题,以及经典的通用GPU(Graphic Processing Unit)体积与功耗过大难于整合到红外设备中的问题,提出在嵌入式GPU平台NVIDIA Jetson TK1中实现并行分离卷积的方法,利用CUDA(Compute Unified Device Architecture)实时执行背景预测算法,实现了在嵌入式GPU平台上高效的红外背景预测算法。实验结果表明,在保证正确预测背景的前提下,利用小体积、低功耗的嵌入式GPU平台可以将运算性能提高到串行运算的15倍以上。  相似文献   

17.
基于GPU的后向投影SAR成像算法   总被引:1,自引:0,他引:1  
后向投影(BP)是一种精确的时域合成孔径雷达(SAR)成像算法,但是其巨大的运算量很难满足实时成像的要求,图形处理器(GPU)具有强大的浮点运算和高度的并行处理能力,为BP算法的实时成像提供了一个很好的平台。提出基于GPU的并行化BP算法,利用了四种优化方法对并行化BP算法进行加速,并且针对共享存储器的bank冲突问题提出了相应的解决方法,减少了共享存储器访问时间。最后给出仿真数据的成像结果,结果表明,与传统的基于CPU单线程的BP算法相比,成像速度可达到70倍以上的提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号