首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
基于VLIW体系结构的DSP寄存器堆的设计   总被引:2,自引:1,他引:1  
在研究了基于VLIW体系结构DSP的特点基础上,通过对寄存器堆的组织结构、组成单元、功能实现等方面的分析,提出了该结构寄存器堆的设计方案。该方案实现了多组数据的正确并行读写操作,满足了VLIW体系结构的CPU对多数据流处理的要求。该方案针对VLIW体系结构采用流水线操作、条件执行的特点,通过对写入数据分别采用写控制信号的方法,实现流水线阻塞和指令的条件执行。由于VLIW体系结构具有很多共性,该方案可以根据具体的硬件进行修改,具有很好的可移植性。  相似文献   

2.
针对数字信号处理器(DSP)深度压缩的指令结构不归整性,难以从指令二进制码中快速提取相关信息的问题, 提出分类检测DSP指令间数据竞争的方法.利用不同功能的指令涉及不同寄存器的特点,在分层译码电路和旁路电路辅助 下,及时检测出数据竞争,产生流水线停顿信号,准确定位出产生数据竞争的指令类型.综合结果证明在分层译码配合下 ,分类检测方法比指令全译码后作检测,速度提高了18.89%.DSP常用程序证明这种方法能有效地覆盖所有出现的数据竞 争,保证基于流水的DSP的正确计算.分类检测数据竞争法比指令中源操作数的比特域与目的操作数的比特域作比较的检 测方法更适合于采用深度压缩指令的DSP,物理实现更简单。  相似文献   

3.
针对动态二进制翻译系统QEMU寄存器分配不考虑基本块之间对寄存器需求的差异性,造成不必要寄存器溢出而导致重复访存开销的问题,提出高效的基于优先级线性扫描寄存器分配算法.该算法基于中间表示与源平台寄存器之间的映射关系,获取每一次生成基本块中间指令预分配寄存器次数并统计排序确定寄存器的优先级,寄存器分配时动态调整寄存器分配顺序,减少寄存器溢出次数,降低生成本地代码指令数量.QEMU动态翻译x86、mips及arm平台的nbench测试集实验结果表明,该算法基于中间代码改进具有很好的跨平台性,有效减少了生成本地代码指令数目,比QEMU优化前翻译性能分别提升了6.7%、6.8%、4.7%.  相似文献   

4.
提出基于等权重准则的共同子表达式消除(CSE)方法减少有限冲击响应(FIR)滤波器的硅面积与功耗开销. 该方法通过在等权重的系数位中选择子表达式, 然后消除不等权重的共同子表达式, 减少加法器数量的同时确保了加法器的平均位宽较小. 另外, 该方法基于折叠直接型结构, 相对于采用转置型结构的传统方法减少约50%的寄存器开销. 针对如何寻找最优的共同子表达式, 介绍了一种低复杂度的矩阵搜索过程. 实验结果表明, 该方法相较于已有的H-CSE方法平均减少46%的电路面积以及69%的功耗; 相较于V-CSE方法平均减少45%的电路面积以及68%的功耗.  相似文献   

5.
排序法是一种基于VelociTI结构的DSP指令分配方法。为了完善排序法,对该方法的不足进行了改进。改进的排序法在实现原有指令分配功能的基础上,完成了多周期NOPs指令的检测和当前执行包地址的生成,并结合指令执行条件测试原理,将排序后的执行包中没有被占用功能单元对应的字段设置为无条件不执行。用改进的排序法成功设计了一个DSP指令分配单元的RTL模型,仿真结果验证了方法的正确性。  相似文献   

6.
为了提高视频图像处理速度与硬件资源利用,针对一种基于精简指令集处理器与数字信号处理器(RISC/DSP)混合体系结构的媒体处理器:浙大数芯(MD32),给出了一种软硬件协同设计策略.所给策略结合视频处理核心算法,研究分析MPEG视频编码标准的处理过程,进行了视频处理指令扩展设计,提高了数据的并行处理能力,利用了指令内并行执行特性.为有效实现扩展指令,处理器执行级采用了可扩展流水级技术.实验结果表明,指令扩展硬件成本仅占MD32的2.7%,逆离散余弦变换实现性能比MMX/SSE指令集实现的性能分别提高31%和23%,运动补偿性能比MMX指令集实现的性能提高了40%.  相似文献   

7.
针对新型多态并行阵列机,设计一种专用处理单元。该处理单元采用四级流水线的超长指令字结构,指令系统采用无寄存器文件的直接寻址方式,加入独有的阻塞-非阻塞模式和邻接共享存储实现分布式指令并行和流处理运算,使用特殊指令完成PE间通信以及MIMD和SIMD的快速切换。实验结果表明,该处理单元能够实现运算模式分区并发执行和切换,工作最大频率可达167MHz.。  相似文献   

8.
针对系统级二进制翻译器在虚拟/物理地址转换中出现的性能瓶颈问题,提出一种基于指令、数据和堆栈等访问区域特征的快速地址转换方法.该方法在翻译态时识别不同区域的内存访问指令,并根据区域特征采取不同的优化算法,对于指令区域和数据区域采用编译时地址转换算法,对于堆栈区域采用连续页面映射算法.在开源高速指令模拟器QEMU上运行嵌入式CPU测试基准程序PowerStone.结果表明,运行态地址转换过程减少了1%~65%,运行态执行周期数减少了11%~38%.  相似文献   

9.
针对信息中心网络缓存放置策略和路由转发策略,提出了一种基于缓存价值的路由转发和缓存放置策略.在缓存价值决策中,考虑到节点繁忙度和路径时延因素,利用夏普利值设计了支持决策的报文格式和路由转发策略;在缓存放置策略中,使用Scope字段,控制缓存副本个数和放置的范围.仿真实验结果表明,该策略有较高的缓存命中率,能有效地减少平均请求跳数.  相似文献   

10.
针对PLC浮点算术运算控制器中运算操作数需传送和存储的问题,提出了一种模块间并行执行寻址与运算操作数存储一体化IP核的思路.采用Verilog语言实现硬件电路构建,分析IP核外部接口结构并利用FPGA并行处理的特点对系统内部功能做出模块划分.在内部时序脉冲作用下,可以完成多种寻址方式访问存储器与寄存器堆以及运算操作数的快速传输.经仿真和板级测试可知,寻址与存储IP核能够按要求自主完成每条指令的功能,操作数据可在1个时钟周期内读取,提高了PLC执行指令速度.  相似文献   

11.
专用指令集处理器模型的研究   总被引:1,自引:0,他引:1  
针对现有专用指令集处理器(ASIP)模型的不足和ASIP的特点,提出了一个新型的ASIP模型——xpMODEL.它以指令行为作为设计核心,引入指令行为有限状态机IB-EFSM建立指令操作的时序调度机制,通过原语操作完成行为中对处理器资源的调用,有效地对指令的流水化操作进行了建模.在对处理器资源的建模中,利用资源库描述处理器的部件、存储和连接,并通过抽象层和行为层的部件双层建模形式有效地支持了对ASIP中专用硬件和外围部件的描述.介绍了xpMODEL对一些复杂执行机制,如forwarding技术、动态调度技术、分支预测技术和中断技术建模的支持,说明了其建模能力相对于现有的ASIP模型的优势.  相似文献   

12.
一种SOC微处理器IP核的优化设计   总被引:1,自引:0,他引:1  
该文提出了多种改善微处理器设计的优化方法.在系统结构上,采用四级流水结构,改善了微处理器的执行效率;为了解决数据相关问题,采用了bypass技术,并进一步提高了流水线的效率.在CPU结构上,采用纯组合逻辑电路和改进的ALU算法,来提高处理器的速度.最后,对该CPU核完成了仿真和综合,并在FPGA上成功地实现.实验结果表明设计的SOC处理器在指令上与通用的PIC16C57的处理器兼容,而执行效率为其4倍,系统时钟可达到40MHz以上.  相似文献   

13.
论述了基于TMS320C67x的实时图像水印处理系统的组成及其工作原理。通过采用一种新的算法,它以Winograd快速离散余弦变换(DCT)算法为基础,并利用TMS320C67x的基于超长指令(VLIW)的并行特征和流水线的执行方式提高DCT算法的性能,完成了实时图像水印的嵌入。  相似文献   

14.
针对部分层间并行球形译码(PIPSD)算法的特点,基于超长指令字(VLIW)和单指令多数据(SIMD)混合结构的矢量处理器原型,合理安排处理器结构参数,选择合适的寄存器数目和长度。根据算法和结构的相互作用特点,挖掘算法内在的数据并行性和指令并行性,设计高效的指令集和相应的功能单元,软硬件协同优化VLIW分布,在支持多种配置的基础上尽可能减小执行周期数,提高译码吞吐率,从而设计出高效的基于专用指令集矢量处理器的可编程并行MIMO检测器。  相似文献   

15.
空间军事系统综合集成研讨厅是分布式的网络结构,含有丰富的信息资源。要想有效利用这些数据以及数据背后所隐含的重要信息,必须建立有效的数据挖掘模式。以移动智能体(agent)技术为基础,将Web数据挖掘和分布式数据挖掘进行松散耦合,建立了合理的挖掘框架,并对其结构进行了详细说明。  相似文献   

16.
传统基于COM+的三层架构开发模式在可重用性、可维护性和可集成性方面存在不足。文章以实现层与层之间的松耦合为出发点,将中间件平台技术引入传统的三层架构,设计并实现了一种基于COM+组件技术的中间件平台,为业务逻辑的定义、实现与运行提供了统一的规范和环境,为复杂应用软件提供集成框架,同时支持统一数据访问、灵活实现业务处理过程,为三层架构软件的开发、运行提供了支撑环境。并与传统的开发模式进行了分析、比较,验证了本平台的有效性。  相似文献   

17.
基于SOA的中小型企业制造执行系统设计   总被引:1,自引:0,他引:1  
针对中小型企业制造执行系统的需求以及信息交互较复杂和成本高的特点,对比传统制造执行系统(MES)架构,提出一种面向服务的信息系统架构.该架构以Web服务技术为基础,实现了制造执行系统的信息共享与较强可扩展性;同时运用该架构结合实例说明了其部分功能的实现方法和调用过程.  相似文献   

18.
分析了Web服务技术与数据仓库相结合的优势,提出了一种基于Web服务技术的分布式数据仓库模型,该模型采用XML的消息传递机制实现了分布式计算。将Web服务技术与数据仓库相结合,扩充了数据仓库的网络功能,解决了与服务器端数据交换的效率、提高了客户端的执行效率,从而可以方便地从大量的数据中抽取有价值的信息,因此.企业和用户能够更加方便地获取信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号