期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

范国忠黄志强张先义杨正龙《现代雷达》2010,32(9)

论述了针对地面雷达,采用统一计算设备架构和数字高程模型来仿真地杂波的一种快速实现算法.为便于后面问题的阐述,介绍了统一计算设备架构的一些基本概念,以便对统一计算设备架构有初步的了解;给出利用统一计算设备架构和数字高程模型数据对地面雷达地杂波进行仿真的基本方法及仿真结果,并进行了简要的分析.仿真结果表明,由该方法得到的地杂波能够较好地反映出特定场景的地面起伏特性;而对于算法速度的分析表明,该方法与传统算法相比有了很大的提升. 相似文献

2.

基于FPGA的DBF导向矢量实时算法

李耀南罗丁利《火控雷达技术》2011,(3):27-31

针对某相控阵雷达的数字波束形成[1]的导向矢量计算,提出了一种基于FPGA的较为灵活的实时算法。利用CORDIC核及流水累加运算,在保证高精度计算的前提下,克服了以往查表带来的资源浪费与不便,直接根据天线阵元间距、波束指向和工作频率就可实时完成系统对波束形成的导向矢量的求取。相似文献

3.

基于CUDA的压缩感知重构算法并行化研究

董蕾黄方卜栓栓冯杰周纪《信息技术》2016,(4):32-36,40

压缩感知重构算法存在计算量大、运行时间过长的问题,无法满足人们对算法处理实时/准实时性要求。最近几年,GPU计算能力得到很大的提升,已成为提高算法处理速度最有效的方式之一。根据GPU的硬件特性,文中提出了基于CUDA的压缩感知重构算法的并行设计。实验结果表明:在NVIDIA K20Xm平台上运行,并行算法取得的加速比可达到100X。相似文献

4.

波束空间的超分辨测向算法研究 总被引：1，自引：0，他引：1

熊键董李梅《电子对抗》2007,(2):4-8

研究了将数字波束形成和超分辨测向相结合的方法。比较了波束形成算法和阵元空间超分辨测向算法的性能，介绍了波束空间MUISC算法的基本原理。仿真证明波束空间的超分辨算法具有计算量小、测向分辨力高和充分利用阵列孔径的特点。相似文献

5.

数字多波束技术信号处理算法研究 总被引：1，自引：0，他引：1

黄玉学李其福桑微《无线电工程》2006,36(7):18-19,52

介绍了数字多波束技术的应用。重点分析了目前较为常用的3种数字多波束技术信号处理的自适应算法并对各种算法进行了比较。自适应算法的选择决定了在环境变化时，波束自适应控制能力和反应速度，以及实现算法所需硬件的复杂性。相似文献

6.

基于CUDA的JPEG压缩算法优化

童炜刘铎《通信技术》2011,44(4):1-4,9

随着图形处理器（GPU）的处理能力的不断增强,图形处理器越来越多地被应用于计算密集型的数据运算处理中。JPEG图像压缩算法中的部分步骤存在典型的并行特性,针对大分辨率图像JPEG压缩串行顺序执行时间开销较大的问题,利用CUDA的并行计算和图形硬件的可编程性,可实现对JPEG图像压缩的加速,同时结合GPGPU硬件结构可实现JPEG压缩程序程序的优化设计。通过程序测试实验,与串行程序比较加速比在20以上。相似文献

7.

LP-SVM在CUDA架构上的加速实现

兰远东《数字技术与应用》2014,(4):130-132,134

为了能在PC机上处理大规模数据集问题,提出了使用CUDA架构对LP-SVM的加速实现方法。该方法针对PC机内存小的缺点,对SVM的分解算法进行改编,得到求解LP-SVM的分解算法。LP—SVM分解算法每次只需要求解一个小规模的线性规划问题,避免一次性把所有训练数据都装进内存。同时把求解线性规划中比较耗时的矩阵运算,移植到CUDA上进行,提高了求解效率。实验结果表明：LP—SVM算法在经过CUDA加速以后,算法的执行效率提高了10—35倍。相似文献

8.

基于导向矢量估计的鲁棒自适应波束形成算法

李洪涛陈诚曾文浩朱晓华《电波科学学报》2015,30(1)

针对在导向矢量存在误差情况下自适应波束形成算法性能严重下降的问题,提出一种基于导向矢量估计的鲁棒自适应波束形成(Steering Vector Estimation Based Robust Adaptive Beamforming,SVE-RAB)算法.算法用导向矢量不确定范围估计真实导向矢量,利用范数约束通过二阶锥规划技术提高波束形成的鲁棒性.算法可在导向矢量存在误差的情况下,对期望信号保持最大增益并有效抑制干扰,且有效提高了波束形成输出的信干噪比(Signal to Interference plus Noise Ratio,SINR).仿真结果验证了算法的有效性和优越性. 相似文献

9.

一种基于LMS的分块并行数字波束形成算法

祁博宇盛卫星《现代电子技术》2008,31(23)

针对大阵列数字波束形成天线系统中计算量和数据传输的瓶颈问题,提出一种基于LMS算法的分块并行的算法.对算法的计算复杂度作了分析并给出计算机仿真结果.结果表明,该算法不仅适合分布式DSP硬件并行计算,计算实时性好,而且算法的自由度和最终形成的波束不受分块的影响. 相似文献

10.

基于GPU 的宽带干涉仪测向算法实现

蒋林鸿何子述程婷贾可新《现代雷达》2012,34(1):35-39

相关干涉仪算法具有实现简单和精度高等优点,但将其运用于宽带测向时存在运算量较大等问题,文中针对该问题提出一种基于GPU的宽带干涉仪测向算法实现,利用CUDA技术对传统相关算法进行改进,使之能够适应于GPU平台并充分发挥图形处理器强大的浮点运算能力及其出色的并行执行性,进而使算法在执行速度上能获得极大提升。算法中采用向量1范数并通过插值拟合得到来波方向的精确估计,仿真结果表明,算法在满足实时性要求的同时也能够保证较高精度。相比于CPU平台,算法的GPU实现能够获得很高的时间加速比。相似文献

11.

利用CUDA快速实现IMM目标跟踪

辛召强沈晓峰《雷达科学与技术》2012,10(6):656-659

根据二维空间内目标作匀速直线运动和匀速圆周运动的特点,在建立目标运动模型和观测模型的基础上采用基于交互多模算法（IMM）的卡尔曼滤波器对机动目标进行跟踪。但由于IMM算法存在大量的递归与矩阵运算,所以实时性降低,这也是工程上难以实现的原因。通过CUDA对算法进行加速实现,在不影响算法性能的基础上实时性大大提高。仿真结果表明,利用该架构实现的IMM算法不仅能够对匀速直线运动和匀速圆周运动的目标进行实时跟踪,而且在运动模型发生变化时,实时性也得到很大提升,滤波误差也比较小。相似文献

12.

基于GPU通用计算CUDA架构的人体检测技术

周晓阳《电子工程师》2012,(2):41-43

随着计算机硬件技术的高速发展,图形处理器（Graphic processing unit,GPU）通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。相似文献

13.

基于GPU的信号产生及脉冲压缩实现

金莉孔文青宋万杰《雷达科学与技术》2017,15(5):505-508

文中采用了一种基于CPU+GPU异构并行架构体系的信号处理方案。按照雷达信号处理流程,通用处理计算机利用CPU串行代码完成核函数启动前数据准备和设备初始化工作,并控制信号处理的任务调度和负载分配,然后将数据通过PCI E总线传输至显存,利用GPU特有的单指令多线程方式,并行实现线性调频信号产生以及线性调频信号频域脉冲压缩算法,并与CPU进行比较。实验结果表明,利用计算统一设备架构技术实现的线性调频信号产生以及脉冲压缩算法取得了比CPU更高的运算效率。相似文献

14.

一种基于Kepler架构GPU的通信仿真加速方法

下载免费PDF全文

韩秉君黄诗铭杜滢《电信科学》2015,31(10):82-88

提出了一种在 Kepler 架构 GPU（graphics processing unit,图形处理器）上利用 CUDA（compute unified device architecture,统一计算设备架构）技术加速通信仿真中DFT（discrete Fourier transform,离散傅里叶变换）处理过程的方法。该方法的核心思想是利用线程级并行技术实现单条收发链路内部DFT运算的并行加速,并利用动态并行和Hyper-Q技术实现不同收发用户对之间链路处理过程的并行加速,从而最终达到加速仿真中DFT处理过程的目的。实验结果表明,相对单核单线程CPU程序和上一代Fermi架构GPU程序,该方法分别能够将DFT处理速度提升300倍和3倍,具有较好的加速效果。相似文献

15.

基于GPU 加速的高阶矩量法研究与应用

下载免费PDF全文

马韬陈明生吴先良刘艺齐琪《微波学报》2013,29(4):34-37

矩量法(MOM)在求解电磁场散射问题时,当未知量数目比较大时,其内存占用和计算时间非常大.基于最佳一致逼近理论构造了高阶矩量法,并引入了计算统一设备架构(CUDA)技术,在图形处理器(GPU)上实现了并行加速计算二维电磁散射问题.实例结果表明,在与快速多极子算法(FMM)相对比下,该方法在较低剖分的情况下,具有很高的计算精度,并且在阻抗矩阵填充和矩矢相乘时的速度大大提升,适用于电大尺寸目标的散射问题. 相似文献

16.

Hungarian algorithm for subcarrier assignment problem using GPU and CUDA

Satyendra Singh Yadav Paulo Alexandre Crisstomo Lopes Aleksandar Ilic Sarat Kumar Patra 《International Journal of Communication Systems》2019,32(4)

General purpose graphics processing units (GPGPUs) have gained much popularity in scientific computing to speedup computational intensive workloads. Resource allocation in terms of power and subcarriers assignment, in current wireless standards, is one of the challenging problems due to its high computational complexity requirement. The Hungarian algorithm (HA), which has been extensively applied to linear assignment problems (LAPs), has been seen to provide encouraging result in resource allocation for wireless communication systems. This paper presents a compute unified device architecture (CUDA) implementation of the HA on graphics processing unit (GPU) for this problem. HA has been implemented on a parallel architecture to solve the subcarrier assignment problem and maximize spectral efficiency. The proposed implementation is achieved by using the “Kuhn‐Munkres” algorithm with effective modifications, in order to fully exploit the capabilities of modern GPU devices. A cost matrix for maximum assignment has been defined leading to a low complexity matrix compression along with highly optimized CUDA reduction and parallel alternating path search process. All these optimizations lead to an efficient implementation with superior performance when compared with existing parallel implementations. 相似文献

17.

基于GPU的AES算法实现

商凯胡艳《电子技术》2011,38(5):9-11

近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU开发方式的束缚,把GPU巨大的通用计算能力解放了出来.本文利用GPU来加速AES算法,即利用GPU作为CPU的协处理器,将AES算法在GPU上实现,以提高计算的吞吐量.最后在GPU和CPU... 相似文献

18.

基于 GPU 加速的并行字符串匹配算法 总被引：1，自引：0，他引：1

谷岳谷建华《微电子学与计算机》2013,(9)

在分析了经典的串行字符串匹配算法（BF ,KMP ,BM ,BDM ,Shift -And/Shift -Or ,ZZL）基础上,对ZZL算法的预处理过程进行改进,并结合GPU的单指令多线程的并行计算特点,对ZZL算法进行并行改进,以达到处理大规模数据的速度提升。相似文献

19.

基于GPU的快速二维沃尔什变换研究 总被引：1，自引：1，他引：1

童莹张健《微电子学与计算机》2011,28(1):46-49,53

提出了一种基于GPU(Graphics Processing Unit,图形处理器)CUDA(Compute Unified Device Architecture,计算统一设备架构)平台的快速二维沃尔什变换(Walsh Transform)实现方法.该方法利用GPU的并行结构和硬件特点,从算法实现、存储类型、逻辑构架设置等方面提高了沃尔什变换的运算速度.实验结果表明,随着图像分辨率的增加,沃尔什变换在GPU上运行时间远低于CPU,GPU比CPU具有更明显的加速效果. 相似文献