共查询到19条相似文献,搜索用时 125 毫秒
1.
为了提高发射宽度,高端DSP普遍采用分簇结构设计.分簇结构的处理器依赖编译器在代码生成的时候指定每条指令所在的簇.针对传统分簇算法中存在参考信息太过局部的问题,提出一种依据资源压力将指令依赖图划分成多个子图,然后对子图进行分簇的算法.最后,验证了该算法能够提高分簇效率. 相似文献
2.
寄存器文件的设计在高性能处理器设计中十分重要,寄存器栈和寄存器栈引擎是提高其性能的重要手段.编译优化常常基于特定的体系机构以及目标机器.本文针对EDSMT微体系结构(基于IA-64的同时多线程体系结构)提出了一种新颖的基于映射表的寄存器机制——MTRM(Mapping Table-based Register Management),它通过映射表将连续的虚拟寄存器物理号映射到不连续的实际物理寄存器,并研究了编译器支持下的及时去配,实验结果表明该方案能有效提高性能. 相似文献
3.
4.
文章介绍了DSP(digital signal processing)处理器中面向滤波,FFT,卷积、相关等算法的循环寻址和位翻转寻址方式的设计,先讨论了循环寻址和位翻转寻址的设计思想和硬件实现算法,再根据算法设计了相应的电路,并且用Cadence工具Verilog-XL进行了逻辑仿真。 相似文献
5.
6.
无线传感器网络LEACH改进算法的设计与仿真 总被引:5,自引:0,他引:5
在众多的无线传感器网络分簇路由协议中,低功耗自适应分簇(Low Energy Adaptive Clustering Hierarchy,LEACH)算法是其中比较流行的协议之一,但它并没有考虑到每个节点的能量状态,而且最优簇首数一旦确定,整个网络通信期间不再改变,因而不能更有效地提高网络的生存时间.文章在LEACH协议的基础上提出了一种改进的高能效无线传感器网络协议-EECRP(an Energy Efficient Cluster Routing Protocol).仿真结果表明,与LEACH相比,EECRP具有更好的能量有效性,并且提高了无线传感器网络的寿命. 相似文献
7.
本文研究了基于单片机的USB转ECP并行口的软硬件的设计方法,重点阐述了并行口ECP模式的软件设计思想,并给出了ECP模式的特点及其协议。利用该系统并行口的ECP模式可以连接其他具有ECP模式的并行口设备,达到了让ECP接口的设备可以和没有并行口的PC机或USB设备进行数据通信的目的。 相似文献
8.
9.
10.
中国电子科技集团公司第三十八研究所研发了首款国产高端数字信号处理芯片"魂芯一号"(BWDSP100),为了打破国外高端芯片的垄断,该国产信号处理器在天气雷达中的应用具有重要意义。在自主开发的软件环境中,通过傅里叶变换法、脉冲对法和批处理方法等3种处理模式实现了天气雷达回波参数估计的处理过程,硬件上利用了"魂芯一号",它具有4个核并行处理,能高效实时完成3种主要处理模式。论证结果表明,"魂芯一号"在精度和速度上均优于国外高端信号处理器。国产信号处理器应用于天气雷达上将突出其优越的实用价值。 相似文献
11.
This JETTA letter describes a new single-latch scan design that uses a single clock for both scan and functional operations. A test mode signal differentiates between normal and test operations. This new design enjoys savings in circuits, pins, test time, and also enjoys the benefits of a high-speed scan capability. 相似文献
12.
Ming-Yung Ko Chung-Ching Shen Shuvra S. Bhattacharyya 《Journal of Signal Processing Systems》2008,50(2):163-177
Digital signal processing (DSP) applications involve processing long streams of input data. It is important to take into account
this form of processing when implementing embedded software for DSP systems. Task-level vectorization, or block processing,
is a useful dataflow graph transformation that can significantly improve execution performance by allowing subsequences of
data items to be processed through individual task invocations. In this way, several benefits can be obtained, including reduced
context switch overhead, increased memory locality, improved utilization of processor pipelines, and use of more efficient
DSP oriented addressing modes. On the other hand, block processing generally results in increased memory requirements since
it effectively increases the sizes of the input and output values associated with processing tasks. In this paper, we investigate
the memory-performance trade-off associated with block processing. We develop novel block processing algorithms that carefully
take into account memory constraints to achieve efficient block processing configurations within given memory space limitations.
Our experimental results indicate that these methods derive optimal memory-constrained block processing solutions most of
the time. We demonstrate the advantages of our block processing techniques on practical kernel functions and applications
in the DSP domain.
相似文献
Shuvra S. BhattacharyyaEmail: |
13.
Viterbi解码器RTL级设计优化 总被引:1,自引:0,他引:1
当今芯片产业竞争激烈,速度低、面积大、功耗高的产品难以在市场中占有一席之地。Viterbi解码器作为一种基于最大后验概率的最优化卷积码解码器,被广泛应用于多种数字通信系统中,却由于其较高算法复杂程度,给芯片设计带来了挑战。针对芯片的速度、面积和功耗,通过对Viterbi解码器RTL级设计的若干优化方法进行研究和讨论,实现了一个应用于DVB-S系统的面积约为2万门的Viterbi解码器。 相似文献
14.
15.
多端口高速通用寄存器文件设计优化 总被引:6,自引:4,他引:2
文章介绍了采用0.13!m、1.2V工艺实现的600MHz、144×65位、20端口(8写12读)通用寄存器文件。在设计中采用了分体、单端读写、端口共享和预充敏感放大等技术,达到了高速和高密度的双重目标,满足了X高性能微处理器的性能要求。 相似文献
16.
17.
Elena Moscu Panainte Koen Bertels Stamatis Vassiliadis 《The Journal of VLSI Signal Processing》2006,43(2-3):161-172
In this paper, we study the performance impact of dynamic hardware reconfigurations for current reconfigurable technology.
As a testbed, we target the Xilinx Virtex II Pro, the Molen experimental platform and the MPEG2 encoder as the application.
Our experiments show that slowdowns of up to a factor 1000 are observed when the configuration latency is not hidden by the
compiler. In order to avoid the performance decrease, we propose an interprocedural optimization that minimizes the number
of executed hardware configuration instructions taking into account constraints such as the “FPGA-area placement conflicts”
between the available hardware configurations. The presented algorithm allows the anticipation of hardware configuration instructions
up to the application’s main procedure. The presented results show that our optimization produces a reduction of 3 to 5 order
of magnitude of the number of executed hardware configuration instructions. Moreover, the optimization allows to exploit up
to 97% of the maximal theoretical speedup achieved by the reconfigurable hardware execution. 相似文献
18.
该文针对长时间储存和高冲击环境导致超声电机正常工作预压力发生改变的背景,设计了一种受到外部环境扰动保持预压力恒定的准零刚度碟簧转子。借鉴了开槽碟簧设计思路,建立其参数化有限元模型。采用灵敏度分析选择主要设计变量,建立了在选定工作预压力附近准零刚度段最长的目标函数。利用有限元数值模型对该碟簧转子进行参数优化设计。结果表明,优化后的碟簧转子在正常工作预压力附近准零刚度段的长度达到0.6 mm,且在冲击环境下满足强度要求,最终通过实验验证了装配有该碟簧转子超声电机的输出特性良好。 相似文献