首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
电子剪切散斑干涉是在电子散斑干涉基础上发展起来的一种测量位移导数的新方法,尤其适合于无损检测实时测量。由于噪声干扰,测量得到的相位差图有大量噪点需要滤波去除。滤波处理计算量大,采用CPU计算需要很长时间完成。为缩短滤波时间,实现实时滤波处理,对四步相移法和Butterworth低通滤波、正余弦均值滤波和复数均值滤波算法,利用GPU并行计算能力强和存储带宽高的特性,开发了基于GPU加速计算的解相位差和滤波算法。对比基于CPU的解相位差和滤波计算,GPU加速计算将图像总体处理时间约1.9s(i7 6500U)降低到了239~366ms(GeForce940MX)或86~116ms(Quadro P3000),且正余弦均值滤波和复数均值滤波算法均可以通过降低滤波次数缩短滤波时间,从而保证在性能较弱的GPU上也能将计算时间压缩到0.2s内,满足实时图像处理的需求。  相似文献   

2.
针对字符串匹配算法在各平台实现的性能问题,将算法在CPU、GPU及FPGA上做了测试对比。GPU具有计算单元多的特点,使得GPU对计算密集型应用有较大的效率提升;而FPGA具有级强的灵活性、可编程性及大量的逻辑运算单元,在处理字符串匹配时的处理速度快。通过对3种实现方式在Snort规则库下做的分析,其结果表明,FPGA的处理速度最快,相比GPU的处理速度提升了10倍。而CPU的串行处理速度最慢,且FPGA的资源消耗最多,GPU次之,CPU的资源消耗最少,且实现最简单。  相似文献   

3.
文中采用了一种基于CPU+GPU异构并行架构体系的信号处理方案。按照雷达信号处理流程,通用处理计算机利用CPU串行代码完成核函数启动前数据准备和设备初始化工作,并控制信号处理的任务调度和负载分配,然后将数据通过PCI E总线传输至显存,利用GPU特有的单指令多线程方式,并行实现线性调频信号产生以及线性调频信号频域脉冲压缩算法,并与CPU进行比较。实验结果表明,利用计算统一设备架构技术实现的线性调频信号产生以及脉冲压缩算法取得了比CPU更高的运算效率。  相似文献   

4.
方程组的迭代法求解在GPU上的实现   总被引:1,自引:0,他引:1       下载免费PDF全文
迭代法是求解大型线性方程组的基本方法.为了充分利用GPU(Graphics Processing Unit,图形处理器)的并行处理能力,本文改进了雅可比迭代法和高斯-塞德尔迭代法的实现过程,从而提高了求解线性方程组的速度.并研究了在不同方程组阶数和迭代次数情况下,GPU对这两种迭代算法的加速效果.实验结果表明线性方程组的阶数为500,迭代次数为100时,雅可比迭代法速度可以提高130倍以上;高斯-塞德尔迭代法速度可以提高40倍以上.最后针对相同的方程组,使用两种迭代法分别在CPU和GPU上求解,并分析了产生不同加速效果的原因.  相似文献   

5.
合成孔径雷达(SAR)成像处理是一项需要进行大量计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA 技术的发展使得GPU 能够方便地进行通用计算。该文提出了一种在GPU上进行SAR 成像的高效方法。与一般GPU 处理方法相比,该方法使得处理过程中的CPU-GPU 往返数据传输由4 次减少到1 次,而且同时利用了工作站上的CPU 与GPU 计算资源。实验结果表明,该方法能够带来相对一般GPU 处理方法2.3 倍的处理效率提升,从而验证了该方法的有效性。   相似文献   

6.
鉴于高斯拉普拉斯(LoG)算子具有各向同性且在有方向性差异的场合并不适应的不足,提出在梯度方向进行零交叉的边缘检测方法。首先使用自适应平滑滤波原图像;然后在水平和垂直两个方向上分别计算图像的一阶梯度分量;使用梯度算子分别对两个求得的一阶梯度分量进行操作,计算两方向上的二阶偏导数;分别对两个方向上的二阶偏导数进行零交叉检测,并合并零交叉点得到边缘图像;最后使用形态学图像处理方法去除边缘图像中面积较小的孤立点区域。结果表明,该方法在噪声环境中具有良好的边缘检测效果,且运算时间与LoG算子检测方法相当。  相似文献   

7.
为快速地去除或减少DSA(Digital Subtraction Angiography)图像的噪声,对比评价KNN(K Nearest Neighbors)算法对高斯噪声、泊松噪声、斑点噪声、椒盐噪声4种噪声去除或减少的效果,帮助医生快速准确地为病人诊断疾病.提出的算法主要贡献在于构建了基于GPU(Graphics Processing Unit)的加速方法,使传统图像去噪的运算速度得到大幅提升.基于图像降质、图像还原过程建模,使用KNN算法对4种噪声去除或减少,并对算法做并行化处理,利用GPU加速实现去噪的过程.通过实验得出,KNN算法能较好地去除或减少高斯噪声、泊松噪声来还原DSA图像,使用CUDA(Compute Unified Device Architecture)编写可在GPU上运行的程序,利用GPU对1 024×1 024像素的24位深度的DSA图像去噪,平均渲染帧率能达到190.53 f/s(帧/秒),较传统CPU(Central Processing Unit)串行,平均处理速度提高70.86倍.使用GPU加速能够快速地处理数据量较大、计算密集的DSA噪声图像,实现有效并且快速的高斯噪声去除,帮助医生精、准、快地诊断疾病.  相似文献   

8.
压缩采样(CS)技术被尝试应用于合成孔径雷达(SAR)图像的压缩。然而,高分辨SAR图像数据量大,导致压缩采样后的恢复过程计算量大,传统的中央处理器(CPU)无法实时成像。为解决这一问题,该文在图形处理器(GPU)平台上设计了CS的并行方法,并实现了SAR图像压缩。实验结果表明,在保证SAR图像压缩性能的前提下,该文设计的GPU并行处理速度能够提高到CPU串行处理的8.8倍。  相似文献   

9.
本文提出使用CPU+GPU异构计算技术对显微镜下的多张不同焦距图像进行图像融合,使用GPU的并行处理功能快速计算图像上每个像素位置的聚焦清晰值,取最高值所在位置的图像像素融合为显微镜超景深图。实验结果显示,采用了CPU+GPU异构计算技术的图像融合计算速度远高于CPU计算的速度。  相似文献   

10.
视网膜血管的形态分析在糖尿病、高血压等疾病的计算机辅助诊断中具有重要的意义。因此文章提出了一种基于线算子引导多尺度匹配滤波的视网膜血管分割方法。利用线算子检测到的血管方向最佳匹配角,根据血管方向与其横截面方向垂直的关系计算出高斯匹配滤波的旋转角,构建3个不同尺度的滤波器,提取3维匹配滤波特征,结合两个线算子和预处理后的图像灰度,构造6维特征向量,使用SVM对眼底图像像素进行分类。这样在每个尺度下只需计算血管方向最佳匹配角所对应的旋转角下的匹配滤波响应,降低了多尺度匹配特征提取的计算量。通过对DRIVE数据库的眼底图像进行实验,得到平均准确度、灵敏度和特异性分别为0.9424、0.7701和0.9697,对视网膜血管进行了有效的分割。  相似文献   

11.
赵亚龙  刘守起  张启灿 《红外与激光工程》2018,47(3):317003-0317003(7)
随着通用计算和图形显示需求的不断增加,图形处理器(Graphics Processing Unit,GPU)在医学、科学计算、图像处理等领域得到了广泛的应用。但它在三维测量领域的应用还只是一个开始。文中基于傅里叶变换轮廓术(Fourier Transform Profilometry,FTP)和三频外差法设计了两套三维测量系统,并利用计算统一设备架构(Compute Unified Device Architecture,CUDA)方法,加速了静态或动态物体的三维重建。在三频外差测量系统中,需要利用高速数字投影模块和相机,同步触发采集小视场表面的12个变形条纹图,然后对图像数据进行处理。实验结果表明:对12幅1 360 pixel1 024 pixel大小的图像进行相位展开运算,GPU方法比CPU方法的效率提高了2 089倍。在基于FTP方法的测量系统中,摄像机只需记录一幅变形条纹图,然后拷贝到显存中,并用CUDA编程的算法进行处理,进而重建出物体的三维面形。基于GPU的FTP方法对一幅1 024 pixel1 280 pixel大小的图像进行计算,其计算时间比CPU方法缩短了27倍。  相似文献   

12.
合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit, CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR 成像处理算法实现方案。该方案解决了GPU 显存不足以容纳一景SAR 数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU 设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C 和INTEL E5645 上的测试表明,与传统基于GPU 的SAR 成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。   相似文献   

13.
真三维活动视频数据的优化研究   总被引:1,自引:0,他引:1  
江寅川  袁杰 《现代电子技术》2012,35(8):116-119,126
提出了一种基于点阵的真三维视频显示技术,该系统利用LED为单元节点组成三维空间阵列,用于显示真三维活动影像。由于数据量巨大,为了加快处理速度,利用CUDA编程模型对计算过程进行优化,把处理过程中可以并行计算的部分交由GPU执行。先把要处理的视频数据传到内存中,由CPU进行一些预处理,然后传到显存,由GPU对视频运动过程等进行处理,处理完后再传到内存,由CPU进行一些后续处理,最终把处理后的数据传出加以显示或存储。通过比较仅由CPU处理与用GPU优化后的计算时间,发现优化后计算速度比优化前快了几十到几百倍,而且数据量越大,优化效果越好,核心多的GPU所得到的加速比大,最后在实验部分给出了用OpenGL仿真的结果。  相似文献   

14.
基于GPU的后向投影SAR成像算法   总被引:1,自引:0,他引:1       下载免费PDF全文
后向投影(BP)是一种精确的时域合成孔径雷达(SAR)成像算法,但是其巨大的运算量很难满足实时成像的要求,图形处理器(GPU)具有强大的浮点运算和高度的并行处理能力,为BP算法的实时成像提供了一个很好的平台。提出基于GPU的并行化BP算法,利用了四种优化方法对并行化BP算法进行加速,并且针对共享存储器的bank冲突问题提出了相应的解决方法,减少了共享存储器访问时间。最后给出仿真数据的成像结果,结果表明,与传统的基于CPU单线程的BP算法相比,成像速度可达到70倍以上的提升。  相似文献   

15.
提出了一种基于图形处理器(GPU)的SAR方位向信号分解的高效实现方法。SAR方位向信号可以通过四参数Chirplet分解方法来分解。此方法的关键难题是计算量过大,计算量主要由2部分组成:构建Chirp原子库,以及SAR方位向信号在过完备库上分解的计算量。与传统的CPU相比,GPU更加适用于密集型和大量数据并行化的计算。提出将算法的核心部分移植到GPU上进行并行计算,充分挖掘其运算潜能。结果表明:该方法与传统的基于CPU的算法相比有两位数以上的效率提升。  相似文献   

16.
复杂轨迹合成孔径雷达后向投影算法图像流GPU成像   总被引:1,自引:0,他引:1  
韦顺军  蒲羚  张晓玲  师君 《电讯技术》2016,56(8):879-886
相对于基于傅里叶变换的频域成像算法,后向投影( BP)算法因采用时域逐点相干积累,更适合于复杂轨迹合成孔径雷达( SAR)高精度成像。但BP算法计算量巨大,限制了其应用于SAR大场景大数据量快速成像。图形处理器( GPU)具有强大浮点运算和并行处理能力,为大场景BP算法快速成像实现提供了途径。结合GPU并行处理,提出了一种基于图像流的复杂运动SAR大场景BP快速成像处理方法。该方法借助BP算法中图像像素点相互独立处理的特性,采用图像像素点并行及图像流程处理,设计了孔径与图像缓存调度方案,提高SAR大场景大数据BP算法成像效率。仿真和机载实测数据结果验证了方法的有效性,在有限GPU显存条件下实现了8192×8192大场景快速成像,并且成像加速比相对于传统CPU单线程处理可达300倍以上。  相似文献   

17.
合成孔径雷达(SAR)的数据运算量不断增加,图形处理器(GPU)为其处理提供了新的运算平台.但是GPU显存小,不足以容纳大场景SAR数据.通过研究聚束SAR成像模式特点,提出了一种适合GPU加速的子孔径成像方案,降低了该算法对GPU显存的要求.在Tesla C2075上的实验结果表明,该方案能够取得良好的成像效果,与C...  相似文献   

18.
韩秉君  黄诗铭  杜滢 《电信科学》2015,31(10):82-88
提出了一种在 Kepler 架构 GPU(graphics processing unit,图形处理器)上利用 CUDA(compute unified device architecture,统一计算设备架构)技术加速通信仿真中DFT(discrete Fourier transform,离散傅里叶变换)处理过程的方法。该方法的核心思想是利用线程级并行技术实现单条收发链路内部DFT运算的并行加速,并利用动态并行和Hyper-Q技术实现不同收发用户对之间链路处理过程的并行加速,从而最终达到加速仿真中DFT处理过程的目的。实验结果表明,相对单核单线程CPU程序和上一代Fermi架构GPU程序,该方法分别能够将DFT处理速度提升300倍和3倍,具有较好的加速效果。  相似文献   

19.
侯明辉 《电子科技》2013,26(10):29-32,35
由于在传统的CPU 平台上进行计算耗时量大,一方面由于SAR回波数据量大,另一方面成像算法复杂。而处理核心众多则是GPU一大优势,适合独立并行结构算法的加速。文中借助GPU 强大的浮点运算和高度的并行处理能力,将SAR成像中ECSA算法在GPU上进行了验证,并得出较好的效果,综合(计算时间+IO时间)加速比有了一定提高。在高分辨率星载SAR成像领域中,CUDA-GPU的运用将是未来发展方向,文中给出了利用GPU处理星载SAR数据可行的初步结论,为进一步优化程序奠定了基础。  相似文献   

20.
Speeded Up Robust Feature(SURF)算法是在计算机视觉领域得到广泛应用的一种图像兴趣点检测和匹配方法。开放计算语言(OpenCL)提供了一个在异构体系结构上,包括GPU,CPU及其他类型处理器,编写并行程序的框架。本文介绍了如何在通用GPU和OpenCL平台上,对SURF算法进行优化与实现。本文对其中一些优化方法,例如kernel线程的配置,局部内存的使用方法等,进行了详细的对比和讨论。最终实现的OpenCL版本的算法在NVidiaGTX260平台上获得了比原始的CPU版本在IntelDual—CoreE54002.7G处理器上至少21倍的加速。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号