首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
合成孔径雷达(SAR)成像算法能够通过图形处理器(GPU)加速来实现处理速度的显著提升。针对后向投影(BP)成像算法的GPU加速,分析了BP算法的并行化和并行处理方法,提出了一种适合GPU加速的BP成像方案;通过研究GPU设计中的多流异步执行技术、数据传输模式和计算速度与精度,进一步提出一种针对BP成像的GPU优化成像方案。通过仿真数据和实测数据在Tesla C2075上的测试结果表明,与GPU非优化方案的实现相比,该方案有了近一倍的速度提升。  相似文献   

2.
该文提出一种基于图形处理器(GPU)的距离多普勒成像算法(RDA),为合成孔径声呐(SAS)的实时成像提供了新的途径。通过GPU平台上的并行方法进行距离向脉冲压缩、固定相位补偿和方位向脉冲压缩,显著提升了距离多普勒成像算法效率。仿真和实验结果表明:在满足成像分辨率的前提下,该文设计的基于GPU的并行RDA和CPU串行算法相比,加速比可达到22,满足实时SAS成像需求。  相似文献   

3.
复杂轨迹合成孔径雷达后向投影算法图像流GPU成像   总被引:1,自引:0,他引:1  
韦顺军  蒲羚  张晓玲  师君 《电讯技术》2016,56(8):879-886
相对于基于傅里叶变换的频域成像算法,后向投影( BP)算法因采用时域逐点相干积累,更适合于复杂轨迹合成孔径雷达( SAR)高精度成像。但BP算法计算量巨大,限制了其应用于SAR大场景大数据量快速成像。图形处理器( GPU)具有强大浮点运算和并行处理能力,为大场景BP算法快速成像实现提供了途径。结合GPU并行处理,提出了一种基于图像流的复杂运动SAR大场景BP快速成像处理方法。该方法借助BP算法中图像像素点相互独立处理的特性,采用图像像素点并行及图像流程处理,设计了孔径与图像缓存调度方案,提高SAR大场景大数据BP算法成像效率。仿真和机载实测数据结果验证了方法的有效性,在有限GPU显存条件下实现了8192×8192大场景快速成像,并且成像加速比相对于传统CPU单线程处理可达300倍以上。  相似文献   

4.
利用GPU计算处理能力,实现并行RD成像算法。提出了一种具有高并行度机载SAR实时并行成像算法实现方案。对实测数据进行成像处理结果表明,文中所提方案能够满足实时成像处理要求,同时与传统实时成像处理系统相比较,能够大幅降低硬件、软件开发成本和周期。  相似文献   

5.
利用GPU的计算处理能力来实现并行的RD成像算法,提出了一种具有高并行度的机载SAR实时并行成像算法实现方案。对实测数据进行成像处理的结果表明,本文提出的方案能够满足实时成像处理的要求,同时与传统实时成像处理系统相比较,能够大幅度的降低硬件成本和软件开发成本和周期。  相似文献   

6.
针对多模式合成孔径雷达(SAR)成像处理中存在的计算效率不足问题,提出了一种基于GPU的多模式SAR统一成像并行加速方法。为充分利用GPU的显存资源,提高算法的运算效率,利用共享内存对矩阵转置、矩阵相乘等部分进行大规模数据并行计算。实验结果表明,该算法大幅度提升了多模式SAR成像的计算效率,最高加速比达到55.62,解决了GPU显存空间利用率较低的问题。  相似文献   

7.
张凌洁  赵英 《电子设计工程》2012,20(17):15-18,22
Floyd-Warshall算法是图论中APSP(All-Pair Shortest Paths)问题的经典算法,为了加快计算速度,提出使用GPU通用计算来实现。文章先从算法的原理入手,层层深入,提出了可以在GPU上运行的并行F-W算法。之后,又根据矩阵分块的原理和GPU共享存储器的使用,实现了改进的GPU并行F-W算法。通过大量测试实验,得到了该GPU并行程序相对于传统CPU并行程序产生超过百倍的加速比的结论。  相似文献   

8.
合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit, CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR 成像处理算法实现方案。该方案解决了GPU 显存不足以容纳一景SAR 数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU 设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C 和INTEL E5645 上的测试表明,与传统基于GPU 的SAR 成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。   相似文献   

9.
结合RD成像算法的特点和GPU的计算处理能力,提出了一种具有高并行度的机载SAR实时并行成像处理方案。对实测数据进行成像处理的结果表明,本文提出的方案能够在不损失分辨率及成像精度的基础上,满足实时处理的要求,同时与传统实时成像处理系统相比较,能够大幅度的降低硬件成本。  相似文献   

10.
谈继魁  方勇  霍迎秋 《电视技术》2015,39(15):42-45
重建算法在压缩感知理论中有着重要的作用,经典的正交匹配追踪(OMP)重建算法在每次迭代中对已选择的原子进行正交化处理以加速算法的收敛速度,但同时增加了算法的计算复杂度。针对这一问题,提出了一种基于图形处理单元(GPU)并行计算的OMP算法,重点对算法中复杂度高的投影和矩阵求逆部分在GPU平台上进行并行设计。实验结果表明基于GPU的并行OMP算法相对于其串行算法加速比可以达到30~44倍,有效地提高了算法的计算效率,拓宽了该算法的应用范围。  相似文献   

11.
王瑞  梁华  蔡宣平 《现代电子技术》2010,33(15):41-43,46
传统SIFT算法的优化和实现都是针对常用处理器(CPU)提出的,处理速度慢,实时性很难得到保证。通过实现基于NVIDIA公司CUDA架构图形处理器(GPU)的SIFT特征提取算法,优化了数据存储结构,提高了数据访问效率。实验结果表明,基于GPU的SIFT特征提取算法充分利用GPU的并行处理能力,计算速度提高幅度明显,图像越大越复杂,提高的幅度越大,处理1600×1200图像时甚至可达近15倍的加速比,极大地提高了SIFT算法在实际应用中的实时性。  相似文献   

12.
韩秉君  黄诗铭  杜滢 《电信科学》2015,31(10):82-88
提出了一种在 Kepler 架构 GPU(graphics processing unit,图形处理器)上利用 CUDA(compute unified device architecture,统一计算设备架构)技术加速通信仿真中DFT(discrete Fourier transform,离散傅里叶变换)处理过程的方法。该方法的核心思想是利用线程级并行技术实现单条收发链路内部DFT运算的并行加速,并利用动态并行和Hyper-Q技术实现不同收发用户对之间链路处理过程的并行加速,从而最终达到加速仿真中DFT处理过程的目的。实验结果表明,相对单核单线程CPU程序和上一代Fermi架构GPU程序,该方法分别能够将DFT处理速度提升300倍和3倍,具有较好的加速效果。  相似文献   

13.
随着计算机硬件技术的高速发展,图形处理器(Graphic processing unit,GPU)通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。  相似文献   

14.
一种基于GPU的高效合成孔径雷达信号处理器   总被引:1,自引:1,他引:0       下载免费PDF全文
随着合成孔径雷达(SAR)应用的不断扩展,其所需要处理的数据量也在不断增加,传统的SAR信号处理器的处理速度成为其应用扩展的瓶颈。为了应对这些挑战,需要高效的SAR信号处理器来加快计算速度。文章利用图形处理器(GPU)这一新颖高效的的计算平台进行SAR信号处理,利用GPU通用并行计算,使用CUDA实现SAR成像算法,充分发挥其计算能力。实验结果表明,其处理速度是基于CPU的传统SAR信号处理器的10倍以上。它为解决在未来SAR信号处理中可能出现的问题提供了一种可靠的方法。  相似文献   

15.
为提高合成孔径雷达(SAR)图像仿真效果,针对SAR图像中舰船目标雷达散射截面(RCS)计算的精度和效率问题,在利用几何建模方法构建三维舰船模型的基础上,采用并行多层快速多极子算法(MLFMA)计算了舰船目标RCS并分析了该算法的并行加速比。仿真实验表明,并行MLFMA算法适用于高频范围内较大尺寸舰船目标RCS的计算,比物理光学法(PO)和物理光学与矩量混合算法(PO—MOM)具有更高的计算精度且并行方案能明显提高求解目标RCS的效率。  相似文献   

16.
唐斌  龙文 《液晶与显示》2016,31(7):714-720
本文提出一种基于GPU+CPU的快速实现Canny算子的方法。首先将算子分为串行和并行两部分,高斯滤波、梯度幅值和方向计算、非极大值抑制和双阈值处理在GPU中完成,将二维高斯滤波分解为水平方向上和垂直方向上的两次一维滤波从而降低计算的复杂度;然后使用CUDA编程完成多线程并行计算以加快计算速度;最后使用共享存储器隐藏线程访问全局存储的延迟;在CPU中则使用队列FIFO完成边缘连接。仿真测试结果表明:对分辨率为1024×1024的8位图像的处理时间为122 ms,相对应单独使用CPU而言,加速比最高可达5.39倍,因此本文方法充分利用了GPU的并行性的特征和CPU的串行处理能力。  相似文献   

17.
低密度奇偶检验(LDPC)码纠错算法是地面数字多媒体广播(DTMB)外辐射源雷达参考信号重构的关键技术之一。LDPC码纠错算法可以改善噪声带来的数据误码,但是计算复杂度高。结合图形处理器(GPU)运算能力强的优点,本文提出了基于硬判决、混合判决、软判决的3类适用于GPU处理的LDPC码纠错并行算法,并对比了3类算法的复杂度、纠错性能以及对雷达信号处理的影响;最后,给出了GPU并行实现方案,对比了算法的实时化效果。仿真与实测结果论证了相较于其他算法,软判决并行算法具有优越的纠错性能和实效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号