首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
冯伟刚  张顺生 《信号处理》2021,37(3):383-389
广义随机傅里叶变换(GRFT:Generalized Radon-Fourier Transform)是一种广义的 MTD(Moving Target De-tection)算法,通过搜索目标的速度、加速度、加加速度等高阶运动信息,补偿多个脉冲间的相位来完成相参积累.这种采用搜索的方法完成众多脉冲的相参积累,必然会带来...  相似文献   

2.
区域场强计算是电磁频谱管理领域的重要问题,提高其计算性能以适应快速变化的战场环境具有重要的意义.提出了一种基于图形处理器(Graphic Processing Units,GPU)的并行区域场强计算方法.通过合理地划分计算步骤,并且为各个计算步骤定制相应的并行方案,使得设计的并行算法适合GPU的体系架构,并行度高.实验结果表明,该文提出的并行算法可获得高达100倍的加速比,并且具有良好的可扩展性.  相似文献   

3.
合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit, CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR 成像处理算法实现方案。该方案解决了GPU 显存不足以容纳一景SAR 数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU 设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C 和INTEL E5645 上的测试表明,与传统基于GPU 的SAR 成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。   相似文献   

4.
基于GPU的高度并行Marching Cubes改进算法   总被引:1,自引:0,他引:1  
提出一种完全基于GPU(graphics processing unit)的高度并行Marching Cubes改进算法.针对Marching Cubes算法流程中数据处理阶段进行优化.首先并行遍历每个体元,以序列形式得到每体元的非空状态,再利用高效流式缩减操作获得非空体元序列以便仅针对非空体元高度并行地生成等值面三角形.实验表明,与同市场价格CPU实现相比,该算法效率最高提高到了前者的9倍以上.  相似文献   

5.
基于GPU的后向投影SAR成像算法   总被引:1,自引:0,他引:1       下载免费PDF全文
后向投影(BP)是一种精确的时域合成孔径雷达(SAR)成像算法,但是其巨大的运算量很难满足实时成像的要求,图形处理器(GPU)具有强大的浮点运算和高度的并行处理能力,为BP算法的实时成像提供了一个很好的平台。提出基于GPU的并行化BP算法,利用了四种优化方法对并行化BP算法进行加速,并且针对共享存储器的bank冲突问题提出了相应的解决方法,减少了共享存储器访问时间。最后给出仿真数据的成像结果,结果表明,与传统的基于CPU单线程的BP算法相比,成像速度可达到70倍以上的提升。  相似文献   

6.
7.
随着计算机硬件技术的高速发展,图形处理器(Graphic processing unit,GPU)通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。  相似文献   

8.
商凯  胡艳 《电子技术》2011,38(5):9-11
近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU开发方式的束缚,把GPU巨大的通用计算能力解放了出来.本文利用GPU来加速AES算法,即利用GPU作为CPU的协处理器,将AES算法在GPU上实现,以提高计算的吞吐量.最后在GPU和CPU...  相似文献   

9.
苗峻  窦修全  郭海召 《信息技术》2023,(8):112-118+124
在应用干涉仪算法测向时,需要对多个接收信号进行逐一处理,而且测向精度往往与本地样本库数据量正相关,因此当需对大量信号进行高精度测向时,常规的计算平台难以保证算法的实时性。针对以上问题,提出一种优化的干涉仪算法,能够在降低样本库数据量的同时保持较高的测向精度,并探索了一种基于GPU并行计算的算法实现方式。经计算机仿真验证,基于GPU实现的优化算法,可将执行速度提升至CPU平台的十余倍。  相似文献   

10.
文中实现了GPU平台加速的BWA-MEM算法,将BWA-MEM算法中的两个热点模块:SMEM查找和chain生成模块利用GPU平台进行加速,通过重构算法流程、精简需要向CUDA设备传输的数据结构,采用合理的任务划分方式来提升BWA-MEM在GPU平台的性能。论文对BWA-MEM算法的特点进行了深入分析,总结了BWA-MEM算法在GPU平台加速效果受到限制的原因。  相似文献   

11.
为了改善人工蜂群算法对于大规模数据、高复杂度问题的执行效率,采用开放计算语言(OpenCL )并行编程模型,提出一种基于图形处理器(GPU )加速的并行人工蜂群算法.将每只采蜜蜂映射到 OpenCL 的一个工作组,跟随蜂采用局部轮盘赌选择,使得人工蜂群算法在 GPU 中加速执行.实验结果表明,并行人工蜂群算法取得了较好的优化效果,提高了算法的运算速度.  相似文献   

12.
高效实现恒虚警概率检测(CFAR)是新型雷达终端信号处理系统研制的重要部分。在基于图形处理器(GPU)的软件化雷达终端架构下,采用统一计算设备架构(CUDA)技术,并根据GPU的特点对算法实现进行优化,实现了高效的软件化CFAR算法,相比CPU软件实现大大缩短了数据处理时间,能够满足雷达信号处理对实时性的需求,同时验证了研发基于GPU的软件化雷达终端具有较高的可行性。  相似文献   

13.
董蕾  黄方  卜栓栓  冯杰  周纪 《信息技术》2016,(4):32-36,40
压缩感知重构算法存在计算量大、运行时间过长的问题,无法满足人们对算法处理实时/准实时性要求。最近几年,GPU计算能力得到很大的提升,已成为提高算法处理速度最有效的方式之一。根据GPU的硬件特性,文中提出了基于CUDA的压缩感知重构算法的并行设计。实验结果表明:在NVIDIA K20Xm平台上运行,并行算法取得的加速比可达到100X。  相似文献   

14.
定位型振动光纤探测主机输出的是一个巨大的传感器阵列信号,数据量大且实时性处理要求高,对数据处理提出了很高的要求。本文立足于定位型光纤周界安防系统,基于英伟达公司(NVIDIA)的统一计算设备架构(CUDA)平台对预处理算法进行图像处理器(GPU)加速。结果表明预处理算法运行在GPU上可以达到很好的加速效果,对系统的实时性能有明显提升。  相似文献   

15.
视频SAR要求高分辨率实时成像,很多成像算法在高分辨率成像时,算法复杂度较高,使用中央处理器(CPU)处理无法实时成像。为解决这一问题,该文提出了一种基于图形处理器(GPU)的圆迹视频SAR实时成像算法。该算法首先根据帧率与重叠率的关系截取回波数据,然后将极坐标格式算法(PFA)中传统的两维插值用效率更高的Chirp Scaling操作代替,并且利用3种优化技术对PFA的GPU实现进行加速。实验结果表明,该文所用成像算法帧率能达到5Hz,满足视频SAR实时成像的速度要求。  相似文献   

16.
针对HEVC帧内预测角度模式算法的特点,提出实现角度预测模式的并行化方法.该方法基于BWDSP1041仿真平台通过分析角度模式算法的可并行性,提出了适合多乘法器并行计算的数据分配方式,结合处理器所搭载的硬件资源,设计了多运算部件并行工作的算法程序.实验结果表明角度预测模式20和垂直模式26在BWDSP1041上利用硬件资源的并行化实现,并行加速比分别达到161.68和344.65.该并行化算法减少了视频编码的时间,其数据分配方案对于帧内预测算法在多核和多运算部件结构上的并行化研究也具有一定的参考价值.  相似文献   

17.
《无线电工程》2016,(3):26-29
通用计算机的遥测信号处理系统通用性、灵活性强,不受硬件平台限制,便于开发、升级和维护,能够有效克服传统硬件平台的不足。多符号检测(MSD)算法性能优良,具有计算量大、并行度高的特点,适合在通用计算机上进行处理。针对如何提高处理速度,在通用计算机平台上研究基于图形处理器(GPU)的并行MSD算法,通过使用GPU对MSD算法并行加速,提高算法运算效率。实验结果表明,在同样条件下,基于GPU的并行MSD算法较串行算法最大可提速约134倍,能够有效提高处理速度。  相似文献   

18.
为了进一步加快JPEG2000的压缩速度,对JPEG2000压缩标准进行研究,分析得出JPEG2000核心算法离散小波变换(DWT)部分数据之间的独立性适合并行化处理。NVIDIA最新推出的CUDA(计算统一设备架构)是非常适合大规模数据并行计算的软硬件开发平台。在通用计算图形处理器(general purpose graphic process unit, GPGPU)上使用CUDA技术实现DWT并行化加速,并针对GPGPU存储空间的特点进行优化。得出的实验结果表明,经过CUDA并行优化的方法能够有效地提高DWT的计算速度。  相似文献   

19.
文中研究了GPU计算及其在密码分析中的应用,详细分析了各自的特点和发展现状。GPU计算发展很快,具有运算密集型和高度并行的特点。密码分析的方法非常丰富,大多数方法都需要大规模的运算,而且密码运算本身也比较简单。通过理论分析并结合实例研究,发现GPU计算非常适合用于密码分析,可以大大提高密码分析特别是穷举攻击的效率。同时,也应拓宽GPU计算在密码分析中的应用,以用于更多的密码分析手段。  相似文献   

20.
针对多模式合成孔径雷达(SAR)成像处理中存在的计算效率不足问题,提出了一种基于GPU的多模式SAR统一成像并行加速方法。为充分利用GPU的显存资源,提高算法的运算效率,利用共享内存对矩阵转置、矩阵相乘等部分进行大规模数据并行计算。实验结果表明,该算法大幅度提升了多模式SAR成像的计算效率,最高加速比达到55.62,解决了GPU显存空间利用率较低的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号