共查询到19条相似文献,搜索用时 78 毫秒
1.
提出了基于构令流的多配多数据流(MCMD)的计算机体系结构并完成设计.通过重构,RCSIMD可支持SIMD和MIMD两种计算模型.RCSIMD中设计的两级配置策略,不但能够实现零配置延迟,而且还能在单周期内实现通信网络在一维和二维结构之间切换,极大地提高了结构的灵活性.多种算法的映射结果表明,RCSIMD体系结构适用于多媒体图像处理应用.在Charter 0.25μm 标准单元库下,RCSIMD的处理阵列的面积为7mm×7mm,时钟周期16ns. 相似文献
2.
3.
可重构计算是未来高性能计算的发展趋势,它兼具了通用计算的灵活性和专用计算的高效性,充分利用系统资源的同时,又能发挥应用程序的效率。可重构编译是推广可重构计算的关键技术,可重构编译系统能够为传统的软件编程人员提供一个体系结构透明的开发平台,并让用户真正灵活利用可重构计算平台。 相似文献
4.
5.
介绍一种采用多条运算流水线技术的粗粒度动态可重构计算系统.使得能够在时间维和空间维上同时开发算法的循环级并行性。在此基础上研究了可重构器件的细织结构形式以及面向动态可重构的互连网络.并给出了在该系统上求解一般问题(如FIR)的重构与执行过程。最后,为实现算法到结构的自动化映射而初步建立了协同编译器框架并展望了在系统中融合向量技术的前景. 相似文献
6.
一种新型高速低成本可重构FFT处理器结构 总被引:1,自引:1,他引:0
文中提出了一种基于FPGA的高速可重构FFT处理器结构.该结构采用精简控制算法[1]可针对从32点到1024点等不同点数数字信号进行FFT处理,并且在Xilinx公司Virtex2p系列FPGA上进行了综合及后仿真.结果表明该可重构结构相比Xilinx IP core而言资源占用减少16%~21%(slice),最高时钟频率提高了10%~30%,输入输出延时减少了56~116个时钟周期,运算效率明显提高,而功耗相当.可适用于低成本高速数字信号处理系统. 相似文献
7.
一种基于FPGA的神经网络的实现 总被引:1,自引:0,他引:1
本文介绍了一种用FPGA实现神经网络的方法。它利用FPGA器件的可重构计算特性,把BP算法分成三个执行阶段并顺序配置到FPGA中执行。这种方法有效地提高了FPGA硬件资源的利用率 相似文献
8.
9.
10.
孙香花 《微电子学与计算机》2011,28(8)
首先介绍可重构技术以及基于过程级的动态可重构计算技术,阐述对动态可重构技术研究的理论价值,接下来介绍高清视频的标准和在社会生活中的应用,进一步介绍目前高清视频最先进的标准之一H.264,阐述国内外相关研究近况,为高清视频技术提供一种新的解决方向进行探讨. 相似文献
11.
扩展频谱通信系统是将基带信号的频谱扩展到很宽的频带上,然后再进行传输的一种系统。pn码的快速捕获,是直扩系统的一项关键的基带技术,文中采用基于最大似然估计的并行FFT算法,完成多路输入信号的频谱分析、载波多普勒频率检测和伪码同步位置的搜索,最后给出了Matlab仿真及RTL实现电路图。该算法已在工程中得到应用,对提高多路扩频信号,同时接收系统捕获时间有良好的效果。 相似文献
12.
一种基于FFT的高精度频率估计算法 总被引:1,自引:0,他引:1
介绍一种适用于估计高斯白噪声背景下的信号频率的快速、高精度估计算法,以及算法原理、设计思想、流程,并使用Matlab进行仿真,给出计算机仿真结果,分析算法优劣。结果表明:本算法具有有效抑制FFT的“栅栏”效应对估计结果的影响、估计精度高、抗噪性能良好、同等精度下运算量小等优点。 相似文献
13.
一种基于SIMD-MCC计算机的二维FFT并行算法 总被引:5,自引:5,他引:0
FFT是图像处理中最重要的全局算子之一。文章以SIMD-MCC并行计算机为模型,讨论了二维FFT的并行实现问题,同时给出了相应的并行算法。该算法利用处理元的局部存储器,可在K×K的阵列上处理M×M的图像(M>K),较好的解决了在固定规模阵列上对大尺寸图像进行处理的问题。通过对算法的性能分析表明本算法是可行和高效的。 相似文献
14.
在单指令多数据流-蝶形网络模型(SIMD-BF)上设计实现FFT算法。当前算法中,W指数的获得需要进行位反,左移和补零操作。本算法采用按时间抽取(Decimation-in-Time)方式,其W指数可以由处理器所在位置轻松获得,只需进行简单左移操作,利用该算法中清晰简单的W指数规律进行递归运算,输出即为结果。在提出的算法中,SIMD-BF模型结构处理器的通信方式发生变化,满足选通直达无需选路时间。改进型算法结果表明,W指数规律明显简单,可节省W的计算时间,可处理倒序输入的待变换序列。 相似文献
15.
16.
17.
在信号谱线分析中,经常用到滑动窗的FFT计算,由于传统的FFT在N值较大和滑动步进较小时,计算量较大,在实时通信系统中难以实现,本文提出一种连续滑动窗的递推FFT算法,该算法充分利用了前窗的计算结果并将输入序列转换为一个输入端仅有少数非零点的特殊序列,不仅降低了计算量,而且提高了使用的灵活性和实时性。 相似文献
18.
基于CORDIC算法的高速可配置FFT的FPGA实现 总被引:1,自引:0,他引:1
论述了一种用于星载合成孔径雷达(SAR)星上数据实时自主处理系统中的高性能FFT的FPGA实现.采用CORDIC算法实现复数乘法,降低了系统的复杂性,提高了运算速度,并提出一种新型便捷的旋转因子产生方法,无需额外的ROM资源.采用块浮点的数据类型,有效避免了大点数FFT的溢出问题.运算点数可配置,能够实现64~32k点,实部、虚部均为16bit数据的FFT运算.整体设计采用16点并行流水结构,提出了适用于16通道并行读写的无冲突地址产生方法.最高工作频率可达118.89MHz,100MHz频率下,1024点FFT的计算时间仅为4.48μs,完全满足高速实时的运算要求. 相似文献
19.
基于FPGA的高速流水线FFT算法实现 总被引:1,自引:0,他引:1
提出了在FPGA(现场可编程门阵列)上实现1024点基4-FFT(快速傅里叶变换)算法的设计方案。方案对FFT算法的核心单元即蝶形运算单元的结构进行了分析和优化,用一个复乘器通过时序控制实现了和3个复乘器同样的效率,而且对整个算法的流程采用了流水线式的工作控制方式,不仅节省了FFT在FPGA上实现时占用的硬件资源,并且极大地提高了算法的运算效率。最后给出了仿真实验结果,并同MATLAB的FFT运算结果进行了对比。结果显示,在100MHz时钟条件下,本方案完成1024点的基4.FFT运算仅需51.28μs,完全满足高速FFT运算的实时性要求。 相似文献