首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
黎源  黄强 《通信技术》2001,(9):106-108
利用DSP的特点,对大整数的表示进行了全新的定义,由此设计了大整数的基本运算算法-无符号数加法、无符号数减法、无符号数乘法、模P运算、无符号数比较大小、W=(X-Y)mod P的算法、模指数运算W=(X^A)mod P七种运算算法,为用DSP实现数字签名打下了基础。  相似文献   

2.
浮点指数运算是粒子滤波算法中的关键运算之一,在信号处理等诸多领域有着十分重要的应用,通过分析Table-driven算法,给出基于Table-driven算法实现浮点指数运算的硬件结构,并以Verilog HDL进行建模仿真及综合,同时将仿真结果与浮点DSP C6701运算结果进行比较。结果表明基于FPGA的浮点指数运算在保持一定精度的条件下,可以获得更快的运算速度。  相似文献   

3.
方志红  俞根苗  张长耀 《现代雷达》2007,29(5):63-64,78
提出了一种计算复数相角的新算法。该算法利用对三角函数的线性拟合及三角函数的近似式递归迭代,显著地提高了算法的效率及运算结果的精度。与传统算法相比,该算法收敛速度快,运算精度高,可以满足实时处理控制的要求。在普通PC机及高速DSP芯片上的试验也充分验证了这一点。  相似文献   

4.
基于FPGA的新型高速FFT算法研究与实现   总被引:2,自引:0,他引:2       下载免费PDF全文
提出一种新型基8/4FFT算法及其实现结构,设计出高速的处理模块.该设计可选择性地实现8 k、4 k及2 k点FFT;通过乘法器的复用,有效降低硬件消耗;应用对称乒乓RAM结构提高了蝶型运算单元的连续运算能力.模块利用Verilog语言进行描述,在Quartus5.0软件环境中完成输入、综合及布局布线.结果表明本文提出的算法结构具有优越的精度和速度,充分能够满足实际应用要求.  相似文献   

5.
卷积运算广泛用于通讯、电子、自动化等领域的线性系统的仿真、分析及数字信号处理等方面.在Matlab中可以使用线性卷积、圆周卷积和快速傅里叶运算实现离散卷积.线性卷积是工程应用的基础,但圆周卷积和快速傅里叶运算实现线性离散卷积具有速度快等优势,圆周卷积采用循环移位,在Matlab中没有专用函数,需要根据圆周卷积的运算过程编制程序代码;快速傅里叶运算(FFT)是DSP的核心算法,在序列比较长时FFT是一种最合适的方法,运算速度快、程序简单,序列越长其优势越明显.以同一个例子介绍了进行离散卷积仿真运算的两种方法与特点.  相似文献   

6.
针对FPGA和ASIC在实现密码算法时的不足之处,本文介绍了一种面向密码算法的异步可重构结构。该结构的运算功能由一个可重构单元阵列提供,数据通路由可重构单元之间的相互连接实现,异步通信采用握手信号完成。在分析握手信号传输延时对可重构结构的影响后,文章提出了一种适合该结构的单元信号传输握手控制电路。同时在单元结构中,使用改进的DSDCVS逻辑来设计其运算电路,减小了单元的面积,提高了单元的工作速度。应用实例表明,在实现密码算法时,面向密码算法的异步可重构结构表现出了比FPGA更好的性能。  相似文献   

7.
本文讨论了DSP芯片进行定点运算所涉及的一些基本问题,这些问题包括:数的定标、DSP程序的定点模拟、DSP芯片的定点运算等。这对于理解定点芯片实现DSP算法具有非常重要的作用。  相似文献   

8.
提出一种浮点型数字信号处理器(DSP)硬核结构,在兼容定点数运算的同时,也为浮点数运算提供较好支持。目前各大现场可编程门阵列(FPGA)主流厂商在实现浮点数运算功能时均采用软核实现方式,即将浮点数运算算法映射到芯片上,通过逻辑资源和DSP模块实现。相比于传统方法,提出的硬核结构在不占用FPGA中其他逻辑资源情况下,仅利用DSP模块便能完成浮点数运算。设计中,充分考虑负载和时延影响,插入多级流水线,显著提高浮点数的计算效率。采用中芯国际(MCI)28 nm工艺设计并完成所提出的浮点型DSP硬核结构。仿真结果表明,所提出的硬核结构的单个浮点数加法和乘法效率为0.4 Gflops。  相似文献   

9.
该文提出了一种应用于移动顶点处理器的高性能低功耗定点特殊函数运算单元电路.该运算单元支持嵌入式图形标准OpenGL ES 1.X 的定点数据格式,并支持小数点后16位精度的倒数、均方根、倒数均方根、对数和指数等初等函数运算.初等函数采用分段二次多项式插值方法近似计算,系数处理中引入2运算电路,相对于传统的设计在相同的精...  相似文献   

10.
基于DSP+FPGA的高速通用实时信号处理平台设计   总被引:1,自引:1,他引:0  
为了数据采集处理设备小型化、智能化和一体化,完成大量数据的采集和实时处理,并通过特殊算法完成复杂运算的目的,本文杓建了一种基于DSP+FPGA的信号处理平台。该平台采用FPGA来实现FFT运算,利用DSP来完成频域信号的分析和处理以及与上位机的通信,应用CPLD来完成整个系统时序控制。该平台主要特点是硬件电路器件具有实时快速的执行速度,并使用了低功耗、低成本的DSP芯片。  相似文献   

11.
高速通用DSP的并行技术   总被引:5,自引:1,他引:4  
近年来,通用DSP的发展速度已超过了专用DSP,而且有些DSP的浮点运算能力是专用DSP无法比拟的。文章主要介绍了ADSP-TS101S的性能和特点,并分析了以其作为处理单元构成并行处理系统的优缺点。  相似文献   

12.
高蒙  程兰  万京 《现代电子技术》2006,29(1):86-88,91
以TMS320LF2407DSP芯片为核心研制了一种液晶特性专用测试仪,测试液晶材料在不同电压和不同频率的电性能,得到被测材料在高压情况下的一系列响应特性,为研究其击穿特性和失效机理提供直接实验数据,为液晶显示材料的选择提供重要依据。介绍了液晶特性专用测试仪的功能、测试原理、系统组成、主要硬件电路和软件设计思想。  相似文献   

13.
An high-speed special function unit (SFU) is presented in this paper. The system supports the single-precision IEEE-754 floating-point standard and implements faithfully rounded reciprocal, square root, reciprocal square root, logarithm, and exponential functions. The functions are approximated by using a novel constrained piecewise quadratic interpolation technique. In this way, the lookup table size is reduced by 40% with respect to previously proposed techniques, without any loss in accuracy. Error analysis and sizing methodology are presented in the paper. The SFU has been implemented in a 0.18-mum CMOS technology. The circuit is able to operate up to 420-MHz clock frequency, with a power dissipation of 160 mW at 420 MHz. The system can be employed in programmable graphics accelerators and in other applications where high-performance function evaluation is needed.  相似文献   

14.
对脉冲压缩技术的原理进行了研究,并在理论分析的基础上介绍某型雷达信号处理系统基于高速通用数字信号处理器TMS320C64x实现数字脉冲压缩,讨论了几个现实问题。给出了相应的硬件框图、软件流程、算法实现及基于所用硬件进行的专门优化,并给出了仿真波形图。该方法经实际应用证明性能可靠,整体性能符合现场要求。  相似文献   

15.
Focused on the issue that division is com-plex and needs a long latency to compute, a method to design the unit of high-performance Floating-point (FP) divider based on Goldschmidt algorithm was proposed. Bipartite reciprocal tables were adopted to obtain initial value of iteration with area-saving, and parallel multipliers were employed in the iteration unit to reduce latency. FP divider to support pipeline execution with the control of state m achine is presented to increase the throughput. The design was implemented in Digital signal process (DSP) chip by sharing the existed multipliers.  相似文献   

16.
施俊强  池明敏 《半导体技术》2001,26(8):49-51,61
描述了基于TMS320C54x数字信号处理器的TCM语音压缩编码系统。该系统是在TMS320C54xDSP入门套件(DSK,DSP Starter Kit)板上实现,充分发挥了芯片的专用硬件逻辑、专业化的指令以及板上TLC320AC01模拟接口语音处理系统。有效而快速地完成了TCM语音压缩系统的模拟,并给出相应的实验结果。  相似文献   

17.
Logarithmic circuits are useful in many applications that require nonlinear signal compression, such as in speech recognition front-ends (SRFEs) and cochlear implants or bionic ears (BEs). A logarithmic current-input analog-to-digital converter (A/D) with temperature compensation and automatic offset calibration is presented in this paper. It employs a diode to compute the logarithm, a wide linear range transconductor to perform voltage-to-current conversion, and a dual-slope auto- zeroing topology with 60 dB of dynamic range for sampling the envelope of speech signals. The temperature dependence of the logarithm inherent in a diode implementation is automatically cancelled in our circuit topology. Experimental results from a 1.5-/spl mu/m 3-V BiCMOS process show that the converter achieves a temperature stability lower than 150 ppm//spl deg/C from 12/spl deg/C to 42/spl deg/C, and consumes only 3 /spl mu/W of power when sampling at 300 Hz. At this level of power consumption, we show that the design is thermal-noise limited to 8 bits of precision. This level of precision is more than adequate for deaf patients and for speech recognition front-ends. The power consumption is almost two orders of magnitude lower than state-of-the-art DSP implementations, and the use of a local feedback topology achieves a 2.5-bit improvement over conventional dual-slope designs.  相似文献   

18.
徐化东  井实 《电子测试》2010,(12):36-39,63
相量测量装置的测量单元直接影响装置测量的有效性和准确性。以DSP芯片为主处理器设计了相量测量装置的测量单元。该单元采用离散傅里叶变换相量测量算法,通过设计相关硬件电路和软件实现,可以将电网信号直接引入,每个基波周期将三相相量的正序、负序、零序分解向量经由DSP的SPI模块传给上层数据处理中心。经实际测试,该单元可以实现对线路相量的实时测量,具有较高测量精度,可以准确地跟踪频率变化,满足电力系统稳定监控的要求。  相似文献   

19.
Increasing mask costs and decreasing feature sizes together with productivity demand have led to the trend of platform design. Software programmable embedded cores are used to provide the necessary flexibility in integrated systems. Facing increasing system complexity, single-issue digital signal processors (DSPs) have been replaced by cores providing the execution of several instructions in parallel. The most common programming model for multi-issue DSP core architectures is Very Long Instruction Word (VLIW) which is based on static scheduling, and enables minimization of the worst case execution time and reduces core complexity. The drawback of traditional VLIW is poor code density, which leads to high program memory requirements and, therefore, requires a large silicon area of the DSP subsystem. To overcome this problem without limiting the core performance, a scalable long instruction word (xLIW) is introduced. A special align unit is used for implementing the xLIW program memory interface. In this paper, the align unit and its main architectural feature, a scalable instruction buffer, is introduced in detail. xLIW is part of a project for a parameterized DSP core.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号