首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于GPU的图形电磁计算加速算法   总被引:2,自引:0,他引:2       下载免费PDF全文
杨正龙  金林  李蔚清 《电子学报》2007,35(6):1056-1060
本文利用现代图形加速卡中GPU(Graphics Process Unit)的可编程管线,实现了图形电磁计算(GRECO)方法.与原有的方法相比,在利用物理光学和物理绕射理论的基础上,计算速度提高了20倍左右.并且利用GPU实现了射线追踪算法,用于目标上多次散射的计算,使得GRECO方法可以快速计算具有凹腔结构目标的电磁散射.本方法对于目标识别和逆合成孔径成像等方面的研究具有重要的应用价值.  相似文献   

2.
谈继魁  方勇  霍迎秋 《电视技术》2015,39(15):42-45
重建算法在压缩感知理论中有着重要的作用,经典的正交匹配追踪(OMP)重建算法在每次迭代中对已选择的原子进行正交化处理以加速算法的收敛速度,但同时增加了算法的计算复杂度。针对这一问题,提出了一种基于图形处理单元(GPU)并行计算的OMP算法,重点对算法中复杂度高的投影和矩阵求逆部分在GPU平台上进行并行设计。实验结果表明基于GPU的并行OMP算法相对于其串行算法加速比可以达到30~44倍,有效地提高了算法的计算效率,拓宽了该算法的应用范围。  相似文献   

3.
星图配准是星图处理应用中的一个重要步骤,因此星图配准的速度直接影响了星图处理的整体速度.近几年来,图形处理器(GPU)在通用计算领域得到快速的发展.结合GPU在通用计算领域的优势与星图配准面临的处理速度的问题,研究了基于GPU加速处理星图配准的算法.在已有配准算法的基础上,根据算法特点提出了相应的GPU并行设计模型,利用CUDA编程语言进行仿真实验.实验结果表明:相较于传统基于CPU的配准算法,基于GPU的并行设计模型同样达到了配准要求,且配准速度的加速比达到29.043倍.  相似文献   

4.
基于GPU的后向投影SAR成像算法   总被引:1,自引:0,他引:1       下载免费PDF全文
后向投影(BP)是一种精确的时域合成孔径雷达(SAR)成像算法,但是其巨大的运算量很难满足实时成像的要求,图形处理器(GPU)具有强大的浮点运算和高度的并行处理能力,为BP算法的实时成像提供了一个很好的平台。提出基于GPU的并行化BP算法,利用了四种优化方法对并行化BP算法进行加速,并且针对共享存储器的bank冲突问题提出了相应的解决方法,减少了共享存储器访问时间。最后给出仿真数据的成像结果,结果表明,与传统的基于CPU单线程的BP算法相比,成像速度可达到70倍以上的提升。  相似文献   

5.
为快速地去除或减少DSA(Digital Subtraction Angiography)图像的噪声,对比评价KNN(K Nearest Neighbors)算法对高斯噪声、泊松噪声、斑点噪声、椒盐噪声4种噪声去除或减少的效果,帮助医生快速准确地为病人诊断疾病.提出的算法主要贡献在于构建了基于GPU(Graphics Processing Unit)的加速方法,使传统图像去噪的运算速度得到大幅提升.基于图像降质、图像还原过程建模,使用KNN算法对4种噪声去除或减少,并对算法做并行化处理,利用GPU加速实现去噪的过程.通过实验得出,KNN算法能较好地去除或减少高斯噪声、泊松噪声来还原DSA图像,使用CUDA(Compute Unified Device Architecture)编写可在GPU上运行的程序,利用GPU对1 024×1 024像素的24位深度的DSA图像去噪,平均渲染帧率能达到190.53 f/s(帧/秒),较传统CPU(Central Processing Unit)串行,平均处理速度提高70.86倍.使用GPU加速能够快速地处理数据量较大、计算密集的DSA噪声图像,实现有效并且快速的高斯噪声去除,帮助医生精、准、快地诊断疾病.  相似文献   

6.
合成孔径雷达(SAR)成像算法能够通过图形处理器(GPU)加速来实现处理速度的显著提升。针对后向投影(BP)成像算法的GPU加速,分析了BP算法的并行化和并行处理方法,提出了一种适合GPU加速的BP成像方案;通过研究GPU设计中的多流异步执行技术、数据传输模式和计算速度与精度,进一步提出一种针对BP成像的GPU优化成像方案。通过仿真数据和实测数据在Tesla C2075上的测试结果表明,与GPU非优化方案的实现相比,该方案有了近一倍的速度提升。  相似文献   

7.
电子剪切散斑干涉是在电子散斑干涉基础上发展起来的一种测量位移导数的新方法,尤其适合于无损检测实时测量。由于噪声干扰,测量得到的相位差图有大量噪点需要滤波去除。滤波处理计算量大,采用CPU计算需要很长时间完成。为缩短滤波时间,实现实时滤波处理,对四步相移法和Butterworth低通滤波、正余弦均值滤波和复数均值滤波算法,利用GPU并行计算能力强和存储带宽高的特性,开发了基于GPU加速计算的解相位差和滤波算法。对比基于CPU的解相位差和滤波计算,GPU加速计算将图像总体处理时间约1.9s(i7 6500U)降低到了239~366ms(GeForce940MX)或86~116ms(Quadro P3000),且正余弦均值滤波和复数均值滤波算法均可以通过降低滤波次数缩短滤波时间,从而保证在性能较弱的GPU上也能将计算时间压缩到0.2s内,满足实时图像处理的需求。  相似文献   

8.
CT数据的获取过程和CT图像的重建过程与图形学的渲染过程极其相似,因此利用图形处理器(GPU)来加速CT重建算法成为了近年来CT研究的热点之一.本文根据单层螺旋CT数据的特点,构造了"平行-扇束"投影模式,实现了基于GPU的单层螺旋CT的三维图像重建算法.数值实验表明,与CPU上的分层重建相比重建速度提高10倍以上.  相似文献   

9.
针对多模式合成孔径雷达(SAR)成像处理中存在的计算效率不足问题,提出了一种基于GPU的多模式SAR统一成像并行加速方法。为充分利用GPU的显存资源,提高算法的运算效率,利用共享内存对矩阵转置、矩阵相乘等部分进行大规模数据并行计算。实验结果表明,该算法大幅度提升了多模式SAR成像的计算效率,最高加速比达到55.62,解决了GPU显存空间利用率较低的问题。  相似文献   

10.
随着航天技术的迅速发展,宇宙中航天器越来越多,利用两行根数(TLE)的数据对航天器的位置、运行状态、运行轨道监控分析判断,防止航天器相互碰撞,显得尤为重要。如果能减少两行根数的计算时间,无疑会让监控更加实时,地面控制中心快速做出相应操作。NVIDIA的CUDA并行计算编程架构结合高性能计算显卡(GPU)正是为了解决高性能计算问题而推出的,可以大幅缩短复杂计算的时间。文章研究了两行根数算法的并行改造,利用CUDA并行架构和GPU硬件作为CPU的协处理器,将两行根数算法的计算时间大幅缩小,解决了两行根数的计算时间问题。实验结果证明利用CUDA并行加速的两行根数算法计算时间大幅减少,提高了计算效率。  相似文献   

11.
为高效地利用射线追踪(ray tracing, RT)方法对室外配用电环境毫米波段进行传播特性研究,提出一种将RT方法与粒子群优化(particle swarm optimization, PSO)算法相结合的RT优化方法.首先进行低分辨率RT,利用距离参数筛选出可能到达接收端的射线发射角度,并将其划分成多个搜索区域;然后在每个搜索区域中利用PSO算法寻找最优路径.该方法的路径损耗仿真结果与传统RT仿真结果以及实测数据都表现出了良好的一致性,场强覆盖预测也和传统RT仿真结果相一致.结果表明,该方法在保证精确度的同时可以有效提高RT计算效率,并避免了传统RT中的接收球问题,具有一定的工程应用价值.  相似文献   

12.
对视频或图像中的行人进行检测使用HOG特征与支持向量机SVM相结合的方法,取得了良好的效果,但是由于HOG特征的计算量非常大,难以满足实时检测的需要,文章针对这一情况提出并实现一种在GPU环境下使用并行加速策略的高效行人检测方法。实验证明这种方法快速有效,大大地提高了行人检测的效率。  相似文献   

13.
A fundamental step in ultrawideband (UWB) communication system design involves the characterization of the indoor propagation channel. In this paper, we show that the UWB propagation channel parameters can be accurately predicted by employing ray tracing (RT) simulation carried out at various frequencies over the signal bandwidth. It is important to note that the determination of the rays reaching a given location is made only once, as the RT algorithm is independent of frequency. A parallel ray approximation (PRA) is used to significantly improve the computational efficiency of the RT based method. Moreover the accuracy of the approximation is verified through a measurement campaign.  相似文献   

14.
由于射线跟踪所需时间随着反射次数增加而迅速增加,反射次数的上限值对于室内射线跟踪的精确度和效率至关重要。因此,本文开展了一个基于统计分析室内场景数据的射线跟踪收敛性研究。通过统计场景中的分布特征,分析射线跟踪不同反射路径的概率,研究接收功率关于射线跟踪最大允许反射次数的收敛关系,得出最优的反射次数上限值,实现优化室内射线跟踪的效率和精确度。将本文模型收敛性与射线跟踪仿真结果的收敛性参数进行对比,在同样计算精确度下,本文模型的收敛结果与射线跟踪仿真收敛结果一致,验证了本文模型的准确性。  相似文献   

15.
改进的交互式多模型粒子滤波跟踪算法   总被引:6,自引:0,他引:6  
通常的交互多模型卡尔曼滤波(IMMKF)或交互多模型扩展卡尔曼滤波(IMMEKF)对于非高斯问题无能为力;对于非线性问题,其性能不及交互多模型粒子滤波算法(IMMPF)。粒子滤波能够处理非线性/非高斯问题,其与交互式多模型结合用来获得更好的跟踪性能。然而,粒子滤波的主要问题是巨大的计算量,由于粒子滤波通常采用大量的粒子数目,将带来很大的计算负荷。该文提出了一种改进的交互多模型粒子滤波算法,其利用多模型综合使用了卡尔曼滤波和粒子滤波,与常规交互式多模型粒子滤波(IMMPF)相比,大大改善了计算效率。对于非线性/非高斯问题,其性能与IMMPF相当;对于线性问题,其性能与IMMEKF相当,并优于IMMPF的性能。  相似文献   

16.
在宽带场景下,传统的数字预失真(DPD)模型需要更高的阶次和更多的系数来校正功率放大器(PA)强非线性和记忆效应,这就会导致极高的计算复杂度和解算系数时的病态问题。文章围绕复杂DPD模型参数辨识和低复杂度DPD算法实现展开深入研究,提出了一种新的基于偏最小二乘(PLS)的低复杂度DPD方法。所提方法根据PA的前逆输入输出特性来获得常数转换矩阵,生成新的基函数矩阵实现模型系数降维。与现有的DPD系数降维方法相比,该方法能在几乎不损失性能的情况下大幅减少DPD模型系数维度和计算复杂度。实验验证了新方法能大幅降低复杂度且具有很好的线性化性能。  相似文献   

17.
为降低3GPP 长期演进(LTE)上行多天线系统分集接收计算复杂度,提高硬件处理效率,改善系统性能,对八天线系统不同干扰强度情况下的干扰抑制合并(IRC)、最大比合并(MRC)、简化的干扰抑制合并(SIRC)和简化的最大比合并(SMRC)算法进行了比较与仿真分析。仿真结果表明在八天线系统中SIRC能够以1dB左右的信噪比损失获得8N倍运算量的降低,并能采用划分天线子阵的方法来提高效率。当存在较强的相关干扰时利用SIRC代替IRC,当干扰较弱或无相关干扰时利用SMRC代替MRC进行分集接收合并,不仅能够明显降低运算量,并能获得较好的效果。  相似文献   

18.
基于FWCM的非线性动态电路时域稳态模拟   总被引:1,自引:0,他引:1  
本文提出一种基于快速小波配置法(FWCM)的非线笥动态电路时域稳态模拟方法。该方法可以对电路瞬态响应过程用大步长(低阶小波)模拟,而对稳态响应过程用小步长(高阶小波)模拟,从而避免了为得到电路稳态响应而在瞬态响应时期花费的大量的模拟时间。并且,该方法具有较低的计算复杂度。一些模拟结果证明,本文的方法是一种十分有效的方法。  相似文献   

19.
Color histogram is now widely used in image retrieval. Color histogram-based image retrieval methods are simple and efficient but without considering the spatial distribution information of the color. To overcome the shortcoming of conventional color histogram-based image retrieval methods, an image retrieval method based on Radon Transform (RT) is proposed. In order to reduce the computational complexity, wavelet decomposition is used to compress image data. Firstly, images are decomposed by Mallat algorithm. The low-frequency components are then projected by RT to generate the spatial color feature. Finally the moment feature matrices which are saved along with original images are obtained. Experimental results show that the RT based retrieval is more accurate and efficient than traditional color histogram-based method in case that there are obvious objects in images. Further more, RT based retrieval runs significantly faster than the traditional color histogram methods.  相似文献   

20.
This paper presents the adaptive state allocation (ASA) algorithm, a new scheme based on maximum likelihood sequence detection (MLSD) of signals transmitted over Rayleigh fading channels. Although MLSD is an optimal scheme, its computational complexity limits many applications. The ASA algorithm is a detection method whose performance is close to that of MLSD, but with greatly reduced computational complexity. Adaptive state partitioning in the trellis diagram is used in this algorithm by measuring the short-term received signal power. Also, an adaptive threshold for selecting only a few states of the trellis is employed in this algorithm based on the Chernoff distance between the probability density functions (PDFs) of correct and incorrect branch metrics. The ASA-DF, a special case of ASA using decision feedback, shows a very good tradeoff between the performance and computational complexity for selective fading channels. Using ASA with diversity reception not only improves the performance, but also decreases the computational complexity in comparison with the computational complexity of using MLSD with diversity reception  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号