期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

黄佳森陈帅王小龙叶凡任俊彦《计算机工程》2013,(9)

传统位反算法在对快速傅里叶变换(FFT)的输出进行重排序时,只能以基-2形式输入数据。为此,提出一种新的基于映射迭代策略的算法,实现对任意基形式FFT输入的输出重排序,包括对映射迭代过程收敛性的证明。得出当FFT的输入点数N确定时,混合基形式下迭代次数为lbN的结论,为硬件架构的确定提供依据。相似文献

2.

基于基2-FFT的GPS信号捕获算法研究 总被引：1，自引：0，他引：1

李欣周辉刘峰龙腾《微计算机信息》2010,(7)

讨论了各种GPS信号捕获算法,针对采用圆周相关法进行GPS信号捕获中FFT点数为非2的整数次幂的问题,分析了传统补零法和内插法的缺陷,并提出了一种新的基2-FFT捕获算法,该算法通过将采样数据和本地参考码均补零到大于自身长度两倍后做基2-FFT进行圆周相关,理论分析和仿真表明,该算法可以得到与非2的整数次幂点数的圆周相关一样的结果。相似文献

3.

频域抽取多维向量基快速傅里叶变换

徐妮妮于海艳肖志涛《计算机应用》2010,30(10):2777-2780

给出了频域抽取(DIF)多维向量基快速傅里叶变换(FFT)算法。对多维频域信号的每一维,采用向量基2频域抽取法,导出了快速算法蝶形运算的一般形式。该FFT算法适合于维数为任意整数的情况,当维数为1时,算法退化为著名的频域抽取向量基2 FFT算法。为了便于编程实现,以频域抽取3维向量基FFT算法为例,给出了快速算法实现流程,该流程易于向任意整数维推广。计算量比较结果显示,频域抽取多维向量基FFT算法比多维分离式FFT算法计算量低。相似文献

4.

三维向量基快速傅立叶算法 总被引：1，自引：1，他引：0

吴云峰徐妮妮肖志涛侯正信《计算机应用》2009,29(2):618-621

给出了三维向量基快速傅立叶变换（3-D Vector Radix FFT）算法。对三维信号采用基2时域抽取,导出了该算法蝶形运算的一般形式。计算量比较结果显示,三维向量基FFT算法比基于行列分解的三维FFT算法计算量低,计算效率高。相似文献

5.

一种偶数基Cooley-Tukey FFT高性能实现方法

龚彤艳张广婷贾海鹏袁良《计算机科学》2020,47(1):31-39

快速傅里叶变换(Fast Fourier Transform,FFT)是最重要的基础算法之一,在科学计算、信号处理、图像处理等领域都有着广泛的应用。随着这些应用领域对实时性需求的进一步提高,FFT算法面临着越来越高的性能要求。在现有的FFT算法库中,FFT算法的求解速度和计算精度受到一定程度的限制,而且也少有研究者对偶数基Cooley-Tukey FFT的高性能实现提出相应的优化策略并对技术进行深入研究。基于此,文中提出了一套针对偶数基的Cooley-Tukey FFT的优化策略和方法。首先构建一个SIMD(Single Instruction Multiple Data)友好、支持混合基的蝶形网络,然后根据偶数基旋转因子特性最大限度地降低蝶形计算的复杂度,接着通过SIMD汇编优化、汇编指令重排及选择、寄存器分配策略制定、高性能矩阵转置算法等方法来优化应用,最后实现一个高性能的FFT算法库。目前,最流行、应用最广的FFT有FFTW和Intel MKL。实验结果表明,在X86计算平台上,新提出的这套针对偶数基Cooley-Tukey FFT的技术所实现的FFT算法库的性能全面优于MKL和FFTW。所提出的这套高性能算法优化和实现技术体系,可推广到除偶数基以外的其他基的实现和优化上,为进一步的研究开发工作奠定一定的基础,进而突破FFT算法在硬件平台上的性能瓶颈,实现一套针对特定平台的高性能FFT算法库。相似文献

6.

基于FPGA的通用FFT处理器的设计 总被引：1，自引：0，他引：1

张裕方康玲《计算机技术与发展》2010,20(8):87-90,95

介绍了一种通用的可以在低端或是高端的FPGA上实现N（N=2M,M=2,3,4…）点FFT变换的方法。设计采用基4布斯编码算法和华莱士树算法设计完成了16X16位有符号数并行乘法器,并采用此并行乘法器为核心设计了FFT算法中的基-2蝶形运算单元,设计了串并转化模块、并串转换模块、移位选择模块、溢出检测模块和地址与控制模块等其它模块,并以这些模块和FPGA内部的双口RAM和ROM为基础组成了基-2FFT算法模块。整个模块采用基-2时域抽取,顺序输入,逆序输出的方法;利用Modelsim完成了FFT模块的前后仿真;利用Matlab编写了用于比较仿真结果和Matlab中FFT函数产生的结果的程序,从而验证了仿真结果的正确性。该模块最后能够在Cyclone EP1C6Q240C8型FPGA上稳定运行在60MHz。整个FFT模块能够在183μs左右完成1024点的16位定点复数FFT运算,能够满足一般工程的要求。该方法也可以用于实现更低点数或是更高点数的FFT运算。相似文献

7.

分裂基算法在管道腐蚀超声内检测中的应用

戴波张慧平唐建《计算机与应用化学》2007,24(4):515-518

管道腐蚀内检测中超声回波信号具有周期性特点,功率谱估计是重要的数据处理方法之一。基于分裂基的FFT算法具有较小的乘法次数和加法次数,且算法结构较好。采用频率抽取分裂基2／4 FFT算法对管道腐蚀超声内检测回波信号进行了处理．得到管道壁厚数据,经分裂基FFT算法和基2 FFT算法比较,分裂基FFT算法明显减少了数据处理时间,提高了检测速度。理论分析和实验结果表明,该分裂基算法精度高,数据处理速度快,满足管道腐蚀内检测的实时性要求。相似文献

8.

基于TMS320F2812的分裂基FFT算法的实现

随顺科马巍随顺旭《计算机光盘软件与应用》2010,(11)

介绍分裂基FFT算法的原理,采用C语言编程实现该算法,并在基于DSP TMS320F2812的实验装置上进行分裂基算法的实现,该算法通用性好,可靠性高,可以实现快速的测量和分析. 相似文献

9.

分裂基FFT在电力系统谐波检测中的应用

王裕黄洪全《自动化技术与应用》2010,29(4):73-76

在电力系统中,由于非线性负载广泛应用,电网被注入了大量谐波,给电力系统中的设备带来很大的危害。谐波检测是电力系统质量分析和谐波补偿的关键技术,而快速傅立叶变换是目前应用最广泛的一种谐波检测方法。本文对分裂基FFT算法的原理进行了研究,采用C语言编程实现该算法,并在基于TMS320F2812DSP的实验装置上进行了基于分裂基算法的谐波检测实验,对采样信号进行FFT运算,能快速检测出电网信号中电压的谐波参数,以进行谐波的实时分析处理,验证了该算法的正确性和高速性,可作为一种通用的算法应用于谐波检测。相似文献

10.

混合小波包与最佳基

陈玉宇张钹王国意《软件学报》1998,9(3):161-168

混合正交小波基是一种包含多个正交小波函数的正交基，本文在混合正交小波基的基础上构造出混合小波包.传统的小波包可以细化频谱窗口以解决正交小波基在高频区频谱局部性差的缺点，混合小波包不仅具有传统小波包的特点，而且可以在不失正交性的情况下改变小波包函数的形状，从而获得更好的细节匹配.小波包的分解可以在频域上进行，通过使用FFT而达到快速的目的. 相似文献

11.

An Efficient Two-Dimensional FFT Algorithm 总被引：1，自引：0，他引：1

Johnson LR Jain AK 《IEEE transactions on pattern analysis and machine intelligence》1981,(6):698-701

A new version of the radix-2 row-column method for computing two-dimensional fast Fourier transforms is proposed. It uses a ``multiple vector' FFT algorithm to compute the transforms of all the columns in an array simultaneously while avoiding all trivial multiplications. The minicomputer implementation of the algorithm runs faster than the 2 × 2 vector radix FFT algorithm. Analysis of the numbers of complex additions and multiplications required indicate that implementations of the radix-4 row-column FFT and 4 × 4 vector radix FFT on the same minicomputer would run slower than the multiple vector implementation. 相似文献

12.

基于FPGA的高速数字脉冲压缩

下载免费PDF全文

王超田黎育高梅国《计算机工程》2008,34(4):252-253

研究一种基于现场可编程门阵列实现的高速脉冲压缩处理的硬件结构。设计通用的蝶形处理单元,使其在脉冲压缩处理的3个阶段都能使用,实现了硬件的共享,提高了硬件资源的利用效率。通过可使用原位运算的并行存储器结构,使得每个时钟周期均可完成一次蝶形运算,极大地提高了处理速度。采用块浮点处理单元,兼顾定点的高速率和浮点的高精度。经过实践验证,时钟在100 MHz时完成4 096点的脉冲压缩的时间为140 μs。相似文献

13.

Reconfigurable Superconducting FFT Processor Using Bit-Slice Block Share Processing Unit

《Microprocessors and Microsystems》2020

We have proposed a reconfigurable high speed and very economical Rapid Single Flux Quantum (RSFQ) superconducting logic design based on the Fast Fourier Transform (FFT) Processor. We have designed a 256 – point FFT processor with the help of a bit-slicing block sharing unit. RSFQ is one of the superconducting device logics comprises of Josephson Junction. The computation complexity of this superconducting FFT is less when the number of points increased. We have proposed three different designs depending on the split radix FFT, the bit-serial radix 2 FFT, and the mixed radix FFT algorithms. The proposed design will slice the 256 – point FFT into eight 32 – point FFT each and each 32 – point FFT is divided into eight 4 – point FFT each for the reduction in hardware cost. For complex multiplication, the computation complexity of our design will be less than N/2 Log₂ N for the radix 2 algorithm based on the Block share processing Unit (BSPU) and further, it is reduced for split radix & mixed radix algorithms based on BSPU based RSFQ logic. Due to this, the speed of the processor is improvised compared to general FFT algorithm based semiconductor technology. we have computed and calculated the latency at 10 GHz for our designs. The main aim of this proposed design is to reduce the complex computation time and better performance of the processor with less hardware cost. This proposed design can furthermore continue to several N² – point by using synchronous clock tree. 相似文献

14.

一种适用于DVB-T系统的新型FFT处理器设计

周加铳陈咏恩《计算机工程与应用》2006,42(27):16-19

针对地面数字视频广播(DVB-T)系统中高速FFT处理器的设计要求,提出了一种新的基16/8混合基算法及其实现结构。采用单个基16/8复用的蝶形运算单元顺序处理,并通过减少乘法器数目,有效降低了硬件消耗;运算单元内部采用“基4+基4/2”级联流水线方式,大大加快了运算速度;此外,应用对称乒乓RAM结构提高了蝶算单元的连续运算能力;并且使用改进的块浮点防溢出机制,以保证运算精度。仿真和实现结果表明该设计具有良好的性能,完全满足实际应用要求。相似文献

15.

改进的多路基-24 FFT处理器设计 总被引：1，自引：1，他引：0

下载免费PDF全文

汪文义王琳凯周金元周晓方《计算机工程》2011,37(7):262-264

给出一种改进的基-24频域抽取FFT算法,基于该算法和SDF结构,提出改进的多路基-24 FFT处理器结构,通过复用常复系数乘法器,减少硬件消耗并维持吞吐率不变。基于改进结构设计2路256点FFT处理器,在SMIC 0.13 μm工艺下综合、布局和布线后的版图核心面积为1.12 mm2,最高工作频率为100 MHz。相似文献

16.

High-Performance Radix-2, 3 and 5 Parallel 1-D Complex FFT Algorithms for Distributed-Memory Parallel Computers 总被引：3，自引：0，他引：3

Takahashi Daisuke Kanada Yasumasa 《The Journal of supercomputing》2000,15(2):207-228

In this paper, we propose high-performance radix-2, 3 and 5 parallel 1-D complex FFT algorithms for distributed-memory parallel computers. We use the four-step or six-step FFT algorithms to implement the radix-2, 3 and 5 parallel 1-D complex FFT algorithms. In our parallel FFT algorithms, since we use cyclic distribution, all-to-all communication takes place only once. Moreover, the input data and output data are both in natural order.We also show that the suitability of a parallel FFT algorithm is machine-dependent because of the differences in the architecture of the processor elements in distributed-memory parallel computers. Experimental results of 2^p3^q5^r point FFTs on distributed-memory parallel computers, HITACHI SR2201 and IBM SP2 are reported. We succeeded to get performances of about 130 GFLOPS on a 1024PE HITACHI SR2201 and about 1.25 GFLOPS on a 32PE IBM SP2. 相似文献

17.

Ultrahigh-performance FFTs for the CRAY-2 and CRAY Y-MP supercomputers

David A. Carlson 《The Journal of supercomputing》1992,6(2):107-116

In this paper a set of techniques for improving the performance of the fast Fourier transform (FFT) algorithm on modern vector-oriented supercomputers is presented. Single-processor FFT implementations based on these techniques are developed for the CRAY-2 and the CRAY Y-MP, and it is shown that they achieve higher performance than previously measured on these machines. The techniques include (1) using gather/scatter operations to maintain optimum length vectors throughout all stages of small-to medium-sized FFTs, (2) using efficient radix-8 and radix-16 inner loops, which allow a large number of vector loads/stores to be overlapped, and (3) prefetching twiddle factors as vectors so that on the CRAY-2 they can later be fetched from local memory in parallel with common memory accesses. Performance results for Fortran implementations using these techniques demonstrate that they are faster than Cray's library FFT routine CFFT2. The actual speedups obtained, which depend on the size of the FFT being computed and the supercomputer being used, range from about 5 to over 300%. 相似文献