期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王田陈健付宇卓《小型微型计算机系统》2005,26(2):307-309

对乘法器的多种实现方式作了综合比较，分析并实现了一种32位全定制高速乘法器，该乘法器与Synopsys Design Ware相应的乘法器相比速度快14％左右．最后对ASIC设计者选择不同用途的乘法器提供了相应的准则．相似文献

2.

王田陈键付字卓《计算机工程》2004,30(21):41-43,63

全新的基于全定制传输门结构42压缩高性能乘法生成器能根据用户输入自动产生并行乘法器的Verilog代码,并对Wallace Tree的连线进行了优化。最后在末级加法器阶段,生成器能根据到达的时延不同自动选择不同加法器最优的分段。在设计某些乘法器时生成器产生的代码综合结果在面积增加10％～20％左右时比Synopsys Design Ware库里相应的乘法器快5％-9％左右。相似文献

3.

基于CSD编码的16位并行乘法器的设计

王瑞光 TIAN Li-bo 《微计算机信息》2008,24(23)

文中介绍了二进制数的CSD(Canonic Signed-Digit)编码技术;针对目前CSD编码大都是用软件预先求得或基于查找表实现,本文设计了一种有/无符号二进制数的CSD码快速转换的电路结构,其速度快、占用资源少.该编码电路用于乘法器中可以减少一半的部分积数目,文中设计了一种16位有/无符号的乘法器,其采用了Wallace加法树和超前进位加法器,整个设计用Verilog HDL语言实现了RTL描述,并在Altera公司的FPGA上进行了实验验证,结果表明该乘法器是可行性的. 相似文献

4.

一种并行乘法器的设计与实现 总被引：1，自引：0，他引：1

王新刚樊晓桠李瑛齐斌《计算机应用研究》2004,21(7):135-137

根据补码的特点对Booth2算法进行了改进,在得到部分积的基础上,采用平衡的42压缩器构成的Wallace树对部分积求和,再用专门的加法器对Wallace产生的结果进行求和得到最终结果。用Verilog硬件语言进行功能描述,并用Design_analyzer对其进行综合,得出用这种改进Booth2算法实现的乘法器比传统的CSA阵列乘法器速度快、规模较大的结论。相似文献

5.

一种低功耗异步乘法器的研究与实现

石伟苏博任洪广王志英《计算机工程与科学》2012,34(5):73-77

同步电路由全局时钟信号周期性地驱动计算,而异步电路只在需要的时候才进行运算,因此异步电路具有天然的低功耗优势。当前的解同步异步电路设计方法仅根据同步电路的物理拓扑结构进行异步设计,而没有考虑同步电路的本身功能行为及所处理数据的特点。本文首先分析了物理拓扑结构、电路功能行为及处理数据对低功耗设计的影响,然后设计实现了一款低功耗异步乘法器。实验表明,实现的乘法器相对于传统解同步异步乘法器具有更低的功耗与更高的性能。相似文献

6.

小数乘法器的低功耗设计与实现

袁博刘红侠《数据采集与处理》2013,28(3)

提出一种针对小数乘法器的低功耗设计算法,其优化指标为综合后小数乘法器内部寄存中间运算结果的寄存器位宽,解决了目前低功耗设计中算法自身逻辑单元被引入系统从而降低系统优化效果的问题.该算法能够在不降低系统工作效率、不损失系统运算精度、不增加额外逻辑单元的条件下,大幅降低系统功耗和面积.在使用该算法对某一射频模块进行优化后,硬件测试结果显示该射频模块对某型号FPGA的逻辑占用率相比优化前降低17.9％,寄存器总数降低30.7％,存储单元占用率降低21.5％.该算法适用于对含有大量小数乘法运算的系统进行低功耗优化. 相似文献

7.

基于跳跃式Wallace树的低功耗32位乘法器 总被引：3，自引：1，他引：2

下载免费PDF全文

李伟戴紫彬陈韬《计算机工程》2008,34(17):229-231

为了提高乘法器的综合性能,从3个方面对乘法器进行了优化设计。采用改进的Booth算法生成各个部分积,利用跳跃式Wallace树结构进行部分积压缩,通过改进的LING加法器对压缩结果进行求和。在FPGA上进行验证与测试,并在0.18 μm SMIC工艺下进行逻辑综合及布局布线。结果表明,与采用传统Wallace树结构的乘法器相比,该乘法器的延时减少了29%,面积减少了17%,功耗降低了38%,能够满足高性能的处理要求。相似文献

8.

一种64位Booth乘法器的设计与优化

下载免费PDF全文

何军朱英《计算机工程》2012,38(16):253-254

针对国产多核处理器的64位整数乘法器面积和功耗开销大的问题,提出一种新的Booth编码方式,对其Booth编码方式进行优化,通过多种方法验证设计优化的正确性,采用标准单元库进行逻辑综合评估。结果表明,工作频率可达1.0 GHz以上,面积减少9.64%,动态功耗和漏电功耗分别减少6.34%和11.98%,能有效减少乘法器的面积和功耗,达到预期目标。相似文献

9.

一种宽位乘法器设计方案

陈雷高德远樊晓桠周昔平彭和平《计算机工程与应用》2003,39(34):28-30

如何以合理的代价构造尽可能高速的低功耗的乘法器,尤其是位数较宽的乘法器(如32~*32,54~*54和64~*64等)是微处理器数据通路设计中极其重要的环节。文中使用一种折衷的补码分段Booth乘法器。经过论证,最后通过布局布线后的结果看出,补码分段Booth乘法器规模小,速度高,非常适合低功耗嵌入式应用。相似文献

10.

基于标准单元库扩展的快速乘法器设计

曾宪恺郑丹丹严晓浪吕冬明葛海通《计算机应用研究》2012,29(5):1778-1780

设计并实现17×17 bit带符号数字乘法器。为了提高乘法器的性能,采用改进的Booth编码算法、Wal-lace树型结构以及基于标准单元库扩展的设计方法。该方法使用逻辑功效模型分析乘法器的关键路径,通过构造驱动能力更为完备的单元以实现关键路径中每一级门功效相等,从而得到最短路径延时。将TSMC 90 nm标准单元库扩展得到扩展单元库,使用两个单元库版图分别实现数字乘法器,基于扩展单元库实现的乘法器速度提升10.87%。实验结果表明,基于标准单元库扩展的半定制设计方法可以有效提升电路的性能,这种方法尤其适用于电路负载过大的情况。相似文献

11.

An Optimized Deep-Learning-Based Low Power Approximate Multiplier Design

M. Usharani B. Sakthivel S. Gayathri Priya T. Nagalakshmi J. Shirisha 《计算机系统科学与工程》2023,44(2):1647-1657

Approximate computing is a popular field for low power consumption that is used in several applications like image processing, video processing, multimedia and data mining. This Approximate computing is majorly performed with an arithmetic circuit particular with a multiplier. The multiplier is the most essential element used for approximate computing where the power consumption is majorly based on its performance. There are several researchers are worked on the approximate multiplier for power reduction for a few decades, but the design of low power approximate multiplier is not so easy. This seems a bigger challenge for digital industries to design an approximate multiplier with low power and minimum error rate with higher accuracy. To overcome these issues, the digital circuits are applied to the Deep Learning (DL) approaches for higher accuracy. In recent times, DL is the method that is used for higher learning and prediction accuracy in several fields. Therefore, the Long Short-Term Memory (LSTM) is a popular time series DL method is used in this work for approximate computing. To provide an optimal solution, the LSTM is combined with a meta-heuristics Jellyfish search optimisation technique to design an input aware deep learning-based approximate multiplier (DLAM). In this work, the jelly optimised LSTM model is used to enhance the error metrics performance of the Approximate multiplier. The optimal hyperparameters of the LSTM model are identified by jelly search optimisation. This fine-tuning is used to obtain an optimal solution to perform an LSTM with higher accuracy. The proposed pre-trained LSTM model is used to generate approximate design libraries for the different truncation levels as a function of area, delay, power and error metrics. The experimental results on an 8-bit multiplier with an image processing application shows that the proposed approximate computing multiplier achieved a superior area and power reduction with very good results on error rates. 相似文献

12.

VLIW处理器可重组乘法器单元设计

杨焱张凯《微处理机》2007,28(3):21-23

在VLIW多媒体芯片的设计过程中,针对传统乘法器与加法器的不足,提出了一种新的分叉华莱氏树结构的乘法器模型,采用可重用的模块化设计思想,通过重用一位全加器阵列对乘法器进行扩展,处理器可以在一个乘法器单元内部同时支持多个32/16/8位的乘法运算,同时使乘法单元的速度和面积均得以优化。仿真测试表明,新的乘法器结构可有效减少FFT、滤波等信号处理以及多媒体处理中常用算法的执行周期,提高了实际运行速度,进一步增强了VLIW处理器在多媒体与信号处理运算上的能力。相似文献

13.

一种基于分组的低功耗变长解码器的设计

闫世晓陈光化李貌《微计算机信息》2005,21(8):53-55

变长码作为一种最流行的数据压缩技术,已被许多数据压缩标准,如JPEG,MPEG-2和H.263等作为编码方法但由于解码过程中的循环依赖性,限制了解码吞吐率。本文介绍了一种基于分组方法的低功耗变长解码器结构,它是利用变长编码本身的信息冗余降低功耗的,通过设计添加一个锁存器的方法来缩短变长解码器的关键路径,描述了一个对变长码表进行分组控制的有限状态机控制器,从而达到高吞吐率输出的目的。相似文献

14.

32位无符号并行乘法器的设计与实现 总被引：1，自引：0，他引：1

胡小龙颜煦阳《计算机工程与科学》2010,32(4):122-124

在基4的Booth算法得到部分积的基础上,采用了优化后的4:2压缩器的Wallace树对部分积求和,最后用CPA得到最终的和。优化下的并行乘法器比传统的CSA阵列乘法器速度快,且延时小。用Verilog进行了功能描述,并用ISE9.2对其进行了综合。相似文献

15.

一种两级式LED恒流驱动电源设计

胡国珍马学军陆小洲彭剑《计算技术与自动化》2015,(1):44-47

根据LED驱动电源设计要求,对设计方案进行合理论证,前级功率因素校正采用升压型斩波电路,控制芯片采用仙童公司的FAN7527,后级采用隔离式单端反激电路实现降压型DC/DC变换,控制芯片为TI公司的UC3843;此外为满足LED驱动电源恒流输出特性,设计中采用AP4310设计一个恒流限压控制器。基于以上结构,完成一款实验样机,通过测试和分析,实验波形与理论波形基本一致,完成本次设计要求的性能指标。相似文献

16.

一种嵌入于微处理器的8位乘加器的设计

韩桂泽胡越黎向慧芳《计算机测量与控制》2006,14(5):651-654

给出了一种嵌入于微处理器,8bit×8bit+20bit并行MAC单元的设计;该设计可完成8bit整数或序数的乘法或乘加运算,具有整数乘加运算的饱和检测和饱和处理功能;设计中采用了一种新型Booth编码方法;对部分积压缩阵列进行了优化,将累加值作为一个部分积参与部分积压缩阵列的累加运算,节省了一级超前进位加法器;压缩阵列采用了一种新型4∶2压缩器,进一步缩短了延时,节省了面积。相似文献