期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

邓珊珊孙义章立生莫志锋谢应科《计算机研究与发展》2008,45(8)

对非2次幂长度的海量数据FFT处理器设计,采用补零技术会造成巨大硬件资源的浪费,且影响算法性能．提出了一种适合于硬件实现,可处理数据长度为q×2“的FFT算法（q为非2质数）以及基于此算法的FFT处理器设计方法．提出的操作数地址映射方法充分利用了算法的同址特性,使得在最少的存储空间需求下,达到最大的数据并行性;设计的混合运算单元有效地统一了混合基和q点DFT运算,减少了运算部件的资源占用率,使得多个运算单元的并行成为可能．仿真结果表明,计算16位20480点DFT运算需要7181个时钟周期,系统频率达到了105MHz．不仅有效地扩展了FFT处理器的数据处理范围,同时满足SAR等实时系统对处理速度的要求．相似文献

2.

基于FPGA的FFT处理器研究与设计 总被引：1，自引：1，他引：0

杨军郭跃东蒋慕蓉《计算机技术与发展》2009,19(9):225-227,231

给出了一种基于GORDIC算法的FFT处理器的设计方案,可实现高速定点实时的FFT运算.该设计以基2时序抽取FFT算法为基础,采用流水线技术来提高整个系统的吞吐率,具有硬件结构简单,配置灵活,器件耦合性低,精度高,系统稳定的特点.该设计已在Ahera芯片EP2C35F672C6上进行了时序仿真,能够满足50MHz的系统时钟. 相似文献

3.

一种高速定点FFT处理器的设计与实现 总被引：3，自引：0，他引：3

付博李栋谢应科《计算机工程》2005,31(11):52-55

提出了一种高速定点FFT处理器的设计方法,此方法在CORDIC算法的基础上,通过优化操作数地址映射方法和旋转因子生成方法,每周期完成一个基4蝶形运算,具有最大的并行性。同时按照本文提出的因子生成方法,每个周期可生成3个旋转因子,且硬件实现简单,无须额外的ROM资源。整个系统采用Xilinx公司的XCV2P30仿真,系统频率达到了130MHz,对于1k点16位的复数FFT需要9．8μs,16k点需要221μs,优于目前绝大多数已有的FFT处理器。相似文献

4.

基于存储技术的高速嵌入式处理器的设计与实现 总被引：1，自引：0，他引：1

张钦韩承德《计算机学报》2007,30(5):831-837

SoPC(片上可编程系统,System on a Programmable Chip)在嵌入式系统中有着广泛的应用,通常用FPGA(现场可编程门阵列,Field Programmable Gate Array)实现.一类嵌入式处理器,例如小波变换处理器、压缩和解压缩处理器、FFT处理器,都可以采用基于存储技术的设计方法.FPGA的片内存储资源相对较少,如何有效地利用FPGA的片内存储资源实现高速的嵌入式处理器成为需要研究的问题.文中以FFT处理器为例说明这种方法的有效性,通过采用一种地址映射调度策略和两种无冲突操作数地址映射方式,减少了所使用的FPGA片内存储资源,提高了处理速度.该FFT处理器在实际系统中起到了关键作用. 相似文献

5.

基于CORDIC算法的FFT处理器设计

下载免费PDF全文

彭清兵李方军《计算机工程》2011,37(23):208-210

采用CORDIC算法和无乘法器的蝶形运算操作,建立Matlab函数模型.合理选择迭代级数和运算数据位宽,设计一种新的高信噪比快速傅里叶变换(FFT)处理器.在最优化设计中,信噪比可以达到88 dB,在加入溢出保护设计后,硬件实现的信噪比可以达到80 dB,功耗减少20.63％.仿真结果表明,该处理器具有芯片面积较小、精... 相似文献

6.

数据全并行FFT处理器的设计 总被引：5，自引：0，他引：5

谢应科付博《计算机研究与发展》2004,41(6):1022-1029

讨论了基4和混和基算法的FFT处理器设计问题,提出的操作数地址映射方法充分利用了FFT算法本身的同址性质,能同时提供蝶形运算所需的4个操作数,具有最大的数据并行性,按照旋转因子存放规则,蝶形运算所需的3个旋转因子地址相同,且寻址方式简单,运算部件采用3个乘法的复数运算算法,有效减少了运算部件的大小,它既可以作基4蝶形运算,也可以同时进行2个基2蝶形运算．采用Altera公司的EP200K400E,工作频率达到89MHz,1024点16位复数FFT需要14．1μs,4096点需要67μs。相似文献

7.

基2×2FFT的地址映射算法 总被引：2，自引：0，他引：2

谢应科侯紫峰韩承德《计算机学报》2000,23(10):1051-1055

FFT处理器是根据 FFT运算特点来进行设计的 ,可以充分提高处理效率 ,达到平均每周期完成一个蝶式运算的处理能力 .在这类芯片中 ,需要并行无冲突的数据访问部件来提供蝶式运算所需的多个操作数 .文中对已有的一些算法进行了比较 ,并提出基 2× 2 FFT的并行数据访问算法 ,通过使用 4个存储体 ,它可以同时完成所需的 4个数据的读取或写入操作 .该算法易于用硬件实现 ,其操作数访问地址的产生速度快于已有的算法 . 相似文献

8.

并行FFT算法在3种并行计算模型上的设计和分析 总被引：1，自引：0，他引：1

陈国良黄伟民《软件学报》1996,7(A00):57-63

本文研究在ＡＰＲＡＭ，ＢＳＰ和ＬｏｇＰ等３种并行计算模型上进行ＦＦＴ算法的设计和分析；分析这３种模型的内在特性及其相互关系；评价它们在和分析并行算法时的可用性和呆操作性。相似文献

9.

位串行SVD处理器的设计

谭曼琼徐成刘彦《小型微型计算机系统》2012,33(6):1358-1362

奇异值分解(SVD)广泛应用于数字信号处理等领域.为提高SVD效率,Brent等提出一种由SVD处理器组成的阵列,应用并行JACOBI算法实现SVD.SVD处理器一般采用CORDIC位并行结构实现.本文比较CORDIC位并行结构和位串行结构,分析了位串行结构在硬件资源以及时钟频率上的优势,采用CORDIC位串行结构设计了SVD处理器,并结合位串行结构的特点对其进行了优化.仿真实验验证了该设计的正确性;CORDIC结构的对比实验表明,与位并行结构相比,位串行设计以一定的处理时间为代价,可以节约大量的硬件资源,适用于硬件资源紧缺的非实时场合. 相似文献

10.

基于FPGA的新型浮点FFT处理器设计

范展梁国龙刘洋《电子技术应用》2008,34(5):23-26

针对现有FFT算法结构复杂、难以并行扩展的问题,提出了一种改进的FFT算法,在此基础上设计了一种基于浮点运算的FFT处理器,并进行了仿真验证。结果表明,新算法大大简化了系统结构,减少了系统的硬件开销,非常容易并行实现,且显著提高了运算效率,完成一次N点的FFT运算只需要N/2个时钟,完全满足实时信号处理的要求。相似文献

11.

自动FFT处理器设计

《电子技术应用》1997,(10)

当前ＦＦＴ（ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍｓ）可以利用ＤＳＰｓ或微处理器以软件方式实现，也可用专用器件及通用的ＶＬＳＩ来获得高效能的ＦＦＴ。对于后者，主要的问题是资金开销、设计风险以及设计时间。本文介绍了用可编程逻辑器件自动实现ＦＦＴ处理器的设计工具，并介绍其设计方法与应用。相似文献

12.

基于CORDIC算法的高速基-4FFT处理器设计 总被引：1，自引：0，他引：1

张晓鹏段哲民彭彬霍健《计算机测量与控制》2010,18(1)

针对目前数字信号处理中对高速傅里叶变换(FFT)的要求,进行了FFT算法研究,采用基-4算法来实现FFT处理器;设计了对称乒乓RAM结构,提高了FFT处理器的连续运算能力和运算速度;采用CORDIC算法代替复数乘法器,用移位加法实现了复数乘法运算,减小了系统资源占用,提高了系统速度,设计了防溢出控制结构,在不增加系统延时的基础上,提高了运算精度;采用AL-TERA公司FPGA进行了验证,仿真结果表明该FFT处理器最大工作频率可达168.86 MHz,能满足高速实时处理的要求。相似文献

13.

并行FFT算法在3种并行计算模型上的设计和分析^*

陈国良李晓峰黄伟民《软件学报》1996,7(Z1):57-63

本文研究在APRAM，BSP和LogP等3种并行计算模型上并行FFT算法的设计和分析;分析这3种模型的内在特性及其相互关系;评价它们在设计和分析并行算法时的可用性和可操作性．相似文献

14.

一种高速并行FFT处理器的VLSI结构设计 总被引：8，自引：1，他引：8

万红星陈禾韩月秋《电子技术应用》2005,31(5):45-48

在OFDM系统的实现中,高速FFT处理器是关键。在分析了基4按时域抽取快速傅立叶变换(FFT)算法特点的基础上,研究了一种高性能FFT处理器的硬件结构。此结构能同时从四个并行存储器中读取蝶形运算所需的4个操作数,极大地提高了处理速度。此结构控制单元简单,便于模块化设计。经硬件验证,达到设计要求。在系统时钟为100MHz时,1024点18位复数FFT的计算时间为13滋s。相似文献

15.

基于FPGA的1024点高性能FFT处理器的设计 总被引：1，自引：0，他引：1

钟冠文卢亚伟付欣玮庞志勇陈弟虎《微计算机信息》2012,(8):66-67,111

为了提高FFT(Fast Fourier Transformation)处理数据的实时性,本文研究了16位1024点FFT并提出了几种有效的优化方案。在Xilinx公司Virtex-E系列FPGA上实现了工作频率50MHz以上、流水线型、基22单路径反馈结构(R22SDF)FFT处理器。仿真和性能评估结果表明本FFT处理器的有较高的性能。相似文献

16.

基于FFT谱分析测频算法的FPGA实现

田西柱《物联网技术》2014,(10):33-35

在信号频谱分析试验中,通过FPGA实现FFT。在MAX＋plusⅡ系统环境下,介绍了流水线结构FFT的蝶形单元设计,详解了旋转因子的生成,通过地址产生单元和块浮点单元实现了运算结果的输出,并将其输出结果与Matlab结果进行比较。相似文献

17.

基于CUDA的高速FFT计算* 总被引：1，自引：0，他引：1

赵丽丽张盛兵张萌姚涛《计算机应用研究》2011,28(4):1556-1559

针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明该算法的高效性,优化后的FFT加速比能达到CUFFT库加速比的2-6倍。相似文献

18.

基于FPGA的FFT处理器的设计

郭宇王建华《微计算机信息》2009,25(8)

本文主要研究基于FPGA的数据处理系统,内部包含一个1024点的FFT处理单元.FFT部分采用基四算法,五级级联处理,并通过CORDIC流水线结构使硬件实现较慢的复乘运算转化为移位和加减运算.双端口RAM、只读ROM全部内置在FPGA芯片内部,使整个系统的数据交换和处理速度得以很大提高,合理地协调了资源和速度之间相互制约问题. 相似文献

19.

基于FPGA的通用FFT处理器的设计 总被引：1，自引：0，他引：1

张裕方康玲《计算机技术与发展》2010,20(8):87-90,95

介绍了一种通用的可以在低端或是高端的FPGA上实现N（N=2M,M=2,3,4…）点FFT变换的方法。设计采用基4布斯编码算法和华莱士树算法设计完成了16X16位有符号数并行乘法器,并采用此并行乘法器为核心设计了FFT算法中的基-2蝶形运算单元,设计了串并转化模块、并串转换模块、移位选择模块、溢出检测模块和地址与控制模块等其它模块,并以这些模块和FPGA内部的双口RAM和ROM为基础组成了基-2FFT算法模块。整个模块采用基-2时域抽取,顺序输入,逆序输出的方法;利用Modelsim完成了FFT模块的前后仿真;利用Matlab编写了用于比较仿真结果和Matlab中FFT函数产生的结果的程序,从而验证了仿真结果的正确性。该模块最后能够在Cyclone EP1C6Q240C8型FPGA上稳定运行在60MHz。整个FFT模块能够在183μs左右完成1024点的16位定点复数FFT运算,能够满足一般工程的要求。该方法也可以用于实现更低点数或是更高点数的FFT运算。相似文献

20.

在具有共享多端口存储器的多机系统上实现FFT

章锦文金延庆《微处理机》1997,(1):24-27

针对笔者已研制的具有共享多端口存储器的多处理机系统，详细介绍了在其上实现FFT算法的方法。相似文献