共查询到20条相似文献,搜索用时 189 毫秒
1.
对非2次幂长度的海量数据FFT处理器设计,采用补零技术会造成巨大硬件资源的浪费,且影响算法性能.提出了一种适合于硬件实现,可处理数据长度为q×2m的FFT算法(q为非2质数)以及基于此算法的FFT处理器设计方法.提出的操作数地址映射方法充分利用了算法的同址特性,使得在最少的存储空间需求下,达到最大的数据并行性;设计的混合运算单元有效地统一了混合基和q点DFT运算,减少了运算部件的资源占用率,使得多个运算单元的并行成为可能.仿真结果表明,计算16位20480点DFT运算需要7181个时钟周期,系统频率达到了105 MHz.不仅有效地扩展了FFT处理器的数据处理范围,同时满足SAR等实时系统对处理速度的要求. 相似文献
2.
3.
数据全并行FFT处理器的设计 总被引:5,自引:0,他引:5
讨论了基4和混和基算法的FFT处理器设计问题,提出的操作数地址映射方法充分利用了FFT算法本身的同址性质,能同时提供蝶形运算所需的4个操作数,具有最大的数据并行性,按照旋转因子存放规则,蝶形运算所需的3个旋转因子地址相同,且寻址方式简单,运算部件采用3个乘法的复数运算算法,有效减少了运算部件的大小,它既可以作基4蝶形运算,也可以同时进行2个基2蝶形运算.采用Altera公司的EP200K400E,工作频率达到89MHz,1024点16位复数FFT需要14.1μs,4096点需要67μs。 相似文献
4.
5.
6.
针对无线城域网中工作在2GHz~11GHz频带的IEEES02.16a标准,在实现其OFDM系统时提出一种高速而且经济的FFT处理器设计方案。设计中采用了Radix-4的频率抽取算法和并行的蝶型计算单元结构,而且将旋转因子预先存储在ROM中以提高处理器运行的速度。设计方案采用了单个蝶型运算单元以达到控制FFT处理器规模的目的。数据的输入与输出都共用一个存储器,这进一步节约了硬件资源损耗。 相似文献
7.
OFDM系统中傅里叶变换的硬件实现方法 总被引:1,自引:0,他引:1
在宽带OFDM系统中,FFT处理器是一个重要组成部分。文章介绍了一种适合OFDM系统的高效FFT处理器的VLSI设计方法,针对高效的特点采用了改进的Radix-4DIT算法,乒乓RAM的设计思想,以及流水线结构。根据Radix-4算法的特点,在基4运算单元CU(Computing Unit)设计,存取地址混序,每级迭代控制,数据对齐等方面也有一些特点。文章针对256点,36bit位长,浮点复数进行FFT运算。目前,此FFT处理器已经通过了FPGA验证,处理能力为100MSPS。 相似文献
8.
针对无线城域网中工作在2GHz~11GHz频带的IEEE802.16a标准,在实现其OFDM系统时提出一种高速而且经济的FFT处理器设计方案。设计中采用了Radix-4的频率抽取算法和并行的蝶型计算单元结构,而且将旋转因子预先存储在ROM中以提高处理器运行的速度。设计方案采用了单个蝶型运算单元以达到控制FFT处理器规模的目的。数据的输入与输出都共用一个存储器,这进一步节约了硬件资源损耗。 相似文献
9.
10.
快速傅里叶变换(fast Fourier transform,FFT)在数字信号处理中占据核心地位.随着高性能超长点数FFT需求的增长,数字信号处理器(digital signal processor,DSP)的计算能力越来越难以满足需求,集成FFT加速器成为重要的发展趋势.为了支持超长点数FFT,将2维分解算法推广到多维,提出一种可集成于DSP的高性能超长点数FFT加速器结构.该结构通过基于素数个存储体的无冲突体编址方法实现了 3维转置运算;通过递推算法实现了高效铰链因子生成;使用单精度浮点二项融合点积运算和融合加-减运算,对FFT运算电路进行了精细化设计.实现了对4G点数单精度浮点FFT计算的支持.综合结果表明:FFT加速器运行频率能够达到1GHz以上,性能达到640Gflop/s.在支持的点数和性能方面都较已有研究成果取得大幅提升. 相似文献
11.
12.
王庚运 《计算机研究与发展》1983,(8)
本文先从理论上讨论了一种新的低成本、高效率的离散富里叶变换数据处理机(FFT)的设计。然后用孙子定理和WFTA算法,设计了一种实用的混合基的FFT数据处理机,它与基2FFT数据处理机比较,省用了四个专用乘法器,不需存储三角函数表格的存储器。控制器微程序设计简化了控制器线路。补码运算、存储和传送避免了原码与补码的转换。乘法用Booth算法的“移位跨零法”。16位字长的乘法用四个加法实现。一个840点的DFT运算时间约需36毫秒。本机具有较高的性能/价格比值,满足了一般实时处理的要求,适合生产和推广使用。 相似文献
13.
卢小平 《数值计算与计算机应用》1989,10(4):236-241
近几年,由于快速Hartley变换(PHT)算法的提出,使DFT的计算面目一新,而且用FHT计算褶积比用FFT优越得多。利用两种变换间的简单关系,借助于FHT不用复数运算和计算结果是实数存储的优点,可以使实数据DFT或褶积节省一半的内存,且速度与实数据FFT算法的速度相同。但是,目前对多维DHT尚无成熟算法(只有二维和三维的算法),本文首次提出适于多维DHT的快速算法。它直观且易于在计算机上实现,从而使得用多维快速DHT计算多维DFT及褶积成为可能,同时也为实谱分析方法提供了一种新的工具。 相似文献
14.
提出了一个基于CORDIC的分裂基FFT/IFFT处理器来计算2048/4096/8192点DFT。蝶形处理器的算术单元和旋转因子产生器采用CORDIC算法实现,所有的控制信号在片内产生。相比于存储旋转因子所需的ROM,CORDIC旋转因子所用ROM尺寸更小。与传统的FFT实现相比功耗减少了25%。 相似文献
15.
针对地面数字视频广播(DVB-T)系统中高速FFT处理器的设计要求,提出了一种新的基16/8混合基算法及其实现结构。采用单个基16/8复用的蝶形运算单元顺序处理,并通过减少乘法器数目,有效降低了硬件消耗;运算单元内部采用“基4+基4/2”级联流水线方式,大大加快了运算速度;此外,应用对称乒乓RAM结构提高了蝶算单元的连续运算能力;并且使用改进的块浮点防溢出机制,以保证运算精度。仿真和实现结果表明该设计具有良好的性能,完全满足实际应用要求。 相似文献
16.
本文提出一种计算长度为2~m的离散傅里叶变换(DFT)的新算法。算法所需的实数乘法和实数加法运算量均低于常规FFT算法,同时具有和常规FFT类似的蝶形运算结构,易于计算机软件和硬件实现。 相似文献
17.
提出了一种快速计算电力系统基波分量的方法,即简化的DFT算法,该算法相比FFT降低了对采样点数的要求,相比传统的DFT降低了运算复杂度。结合DSP处理器已将此算法应用于全场景试验系统中,另外,基于此算法还提出了一种校正电压电流幅值精度的方法,并通过实验证明了此方法的有效性。 相似文献
18.
19.
提出了Radix-4 FFT的优化算法,采用该优化算法设计了64点流水线IFFT/FFT处理器,该处理器可以在64个时钟周期内仅采用3个复数乘法器获得64点处理结果,提高了运算速度,节约了硬件资源。通过Xilinx XC2S300E Spartan2E系列的xc2s300e器件进行下载验证,仿真结果与MATLAB计算结果误差小于0.5%,该处理器已经成功应用于某OFDM通信系统中。 相似文献