期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张惠臻王超《计算机科学》2013,40(3):31-35

可重构指令集处理器能够根据应用程序特点动态扩展其指令集,其硬件架构和软件工具的设计与传统设计有很大不同。在研究可重构指令集处理器软硬件特性的基础上,提出一种集成动态采样剖析硬件的可重构指令集处理器架构。该处理器具有3种不同的工作模式,它通过剖析硬件采样获取程序热点,利用配套工具链半自动地完成指令扩展生成、编译器重定向和可编程硬件逻辑配置,从而获得在不同嵌入式应用领域的硬件适应性和软件兼容性。针对性的实验结果表明,该处理器架构的采样剖析机制准确有效,并且在增加有限的硬件开销的情况下,能够很好地适应应用变化。相似文献

2.

可重构指令集计算机综述

史莉雯 FAN Xiao-ya 《微处理机》2008,29(2)

简要介绍了可重构指令集计算机的体系结构、特征、以及发展状况,并在指令重构的基础上对目前可重构指令集计算机面临的问题作了一些讨论。相似文献

3.

可配置流处理器核心级指令设计及相关编译技术研究

下载免费PDF全文

何义任巨杨乾明管茂林文梅张春元《计算机工程与科学》2009,31(11)

针对目前微处理器面对通用性、高性能、功耗效率的矛盾,我们提出了可配置流处理器的解决方案。本文重点研究了可配置流处理器中核心级指令设计及相关的编译技术,其核心设计思想是根据应用的计算特征设计流处理器中的核心级指令集,从而降低指令集硬件资源的需求。相似文献

4.

下一代处理器的扩展指令集

Rowan 《大众硬件》2003,(6):97-103

在这篇详细的技术报道里，我们要谈论一下振奋人心的扩展指令集发展史，还有Intel最新的Prescott处理器中的扩展指令集技术。在给软件开发人员带来很多新的特性和研发优势的同时。我们也将比较Intel与AMD两种不同指令集的特点。相似文献

5.

基于可重构处理器的并行优化算法

下载免费PDF全文

刘石柱尹首一殷崇勇刘雷波魏少军《计算机工程》2012,38(21):286-289

为挖掘可重构处理器的内在并行性,需要编译器通过分析程序的并行性来决定可重构处理器硬件最好的执行模式。为此,提出一种基于可重构处理器的并行优化算法。将有向无环图的并行计算部分映射到可重构处理器上,对任务实现3个不同层次的并行性(指令级并行、循环级并行、线程级并行)。测试结果表明,该算法使得可重构处理器在处理任务时比未用并行优化算法的性能提升1.2倍左右。相似文献

6.

基于指令集模拟器的处理器建模与验证 总被引：1，自引：2，他引：1

下载免费PDF全文

严迎建徐劲松陈韬刘军伟《计算机工程》2008,34(5):248-250

介绍处理器仿真建模技术以及指令集模拟器在其中的应用,讨论处理器ISA, MA模型建立以及指令精确、时钟精确的指令集模拟器实现方法,提出一种基于多线程技术的调试器集成方法,介绍指令集模拟器在一款密码专用微处理器开发过程中的具体应用方法。相似文献

7.

基于流密码的可重构处理结构及其专用指令集研究

刘婷婷欧阳旦王志远汤光明《计算机应用与软件》2010,27(1):272-274

在对多种流密码算法生成结构进行分析的基础上,提出一种基于流密码的可重构处理结构,并在总结重构流密码算法使用频率较高的基本操作类型的基础上,为该流密码可重构处理结构设计了一种专用指令集。描述了指令的具体格式,并对指令性能进行了评估。结果表明,该指令集作用在该流密码可重构结构上可灵活高效地实现多种流密码算法。相似文献

8.

可重构三值光学处理器的原理、基本结构和实现

金翊王宏健欧阳山周裕沈云付彭俊杰刘学民《中国科学:信息科学》2012,(6):778-788

文中论述了三值光学处理器的重构原理、重构结构和重构操作,给出了三值光学运算器和运算基元的典型结构、分类、命名、重构电路、重构指令和重构例程.文中还对三值光学计算机的高速度性能和低功耗性能作了简单分析.最后描述了一位运算基元的重构实验,实验结果表明本文论述的可重构三值光学处理器原理正确,重构器件和重构指令有效. 相似文献

9.

一种虚指令集的设计与翻译技术的研究

徐怀亮张德彬刘晓升朱巧明《计算机应用与软件》2010,27(12)

分析当前流行的几种指令仿真器,为设计一种具有重用性的指令仿真器,研究了Java虚拟机技术,提出利用虚指令仿真技术来解决仿真器可重用性问题.首先介绍了虚指令技术,提出了构件虚指令的参考原则和方法,描述配置文件的设计模式以及匹配规则,并详细说明了指令翻译的过程,为了提高仿真速度,还讨论了几种性能优化技术. 相似文献

10.

对数函数ln(x)在SDTA指令集结构上的实现

甘新标戴葵沈立王志英《计算机工程与科学》2009,31(2)

SDTA指令集体系结构是一种基于传输触发的VLIW体系结构。本文结合SDTA指令集结构的特点,经过循环展开和循环化简、强度消弱、过程集成、机器方言和指令归并等指令调度优化技术,高效实现了自然对数函数ln(x)。实验结果表明,在Neuron处理器上,ln(x)不但数据精度高,而且运行周期数只有gcc3.2.2数学库中自然对数函数运行周期数的33%左右。相似文献

11.

基于二进制插桩的ASIP处理器指令集混合仿真方法

邱吉高翔彭飞汪文祥蒋毅飞《计算机研究与发展》2012,(Z1):330-335

指令集仿真器在ASIP处理器硅前软件开发中发挥着重要的作用,但使用传统仿真方法的指令集仿真器仿真速度较慢.基于二进制插桩,提出了ASIP处理器指令集混合仿真方法,以混合仿真的方式,使基础指令直接运行在宿主机上,仅对扩展指令仿真,从而降低仿真开销,提升仿真速度.实验表明,采用此方法对主流高清音视频解码软件进行仿真的平均速度达到了1058.5MIPS,是采用当前先进的动态二进制翻译仿真方法仿真器速度的34.7倍. 相似文献

12.

面向特定应用的指令集自动扩展

下载免费PDF全文

吕雅帅沈立王志英戴葵《计算机工程与科学》2007,29(6):84-86

面向应用扩展指令集是面向特定应用处理器设计过程的一个重要环节,这一工作的自动实现对于缩短产品开发周期具有非常重要的意义。现有的技术未能实现该过程的完全自动化,而且在选择指令时并没有全面考虑指令对处理器面积和功耗的影响。本文设计并实现了一个面向特定应用的指令集自动扩展系统,该系统不仅可以根据应用特征自动扩展
新指令,而且可以自动完成编译器的修改。模拟结果显示,扩展的新指令能够在保持功耗、面积基本不变的前提下,带来4.7%～16.7%的性能提升。相似文献

13.

面向Cache优化的向量指令集设计与测评

曾坤《计算机工程与科学》2009,31(Z1)

为微处理器扩展向量指令集是提升现代微处理器性能的一种可行手段,然而传统向量指令对存储系统的访问表现出较差的局部性,因此难以与现代微处理器设计中广泛使用的Cache很好的结合。本文以优化Cache性能为目标,对传统向量指令集进行改造,提出了COV(Cache Optimized Vector Instruction Set)向量指令集,并以OpenRISC1200为平台,对该指令集进行了实现与测评,获得了约四倍的性能加速比。相似文献

14.

可扩展处理器中最大凸自定义指令迭代识别研究

王珊珊刘万军肖成龙《计算机研究与发展》2018,55(7):1584-1596

由于可扩展处理器能够在设计周期、灵活性、性能以及功耗等方面提供良好的折中,近年来,可扩展处理器大量地在嵌入式系统和电子设备中使用.自定义指令自动识别是可扩展处理器设计的关键.针对自定义指令自动识别问题,提出并实现了从给定的应用程序代码中自动识别最大凸自定义指令(maximal convex subgraphs, MCSs)的迭代设计流程.提出的设计流程解决了2个关键问题：MCSs自动枚举问题和MCSs自动选择问题.针对MCSs枚举问题,提出了一种夹心方式枚举所有候选最大凸自定义指令,该算法结合了自下而上和自顶向下方式的优点.与最新算法相比,提出的算法可以实现数量级的加速.针对MCSs选择问题,提出了一种利用候选指令之间的重叠关系建立兼容图,并应用非重叠规则来修剪大量的搜索空间的精确选择算法.实验结果表明：利用提出的精确算法,在大多数情况下可以找到用于最大化提升性能的MCSs. 相似文献

15.

面向可重构编译技术的RAM访问优化算法

下载免费PDF全文

杨敏吴艳霞顾国昌孙延腾《计算机工程》2011,37(2):284-285

在基于低层虚拟机的四层C-to-VHDL可重构编译架构上,针对RAM访问和设计执行性能之间的矛盾,提出一种RAM读取优化算法。通过对IR访存指令及数据相关性的分析,创建专用数据通路,优化RAM的访存过程。实验结果表明,该优化算法能够有效减少RAM访问次数。相似文献

16.

遗传算法和关键事件禁忌搜索相融合的ARM/Thumb处理器指令选择

吴圣宁李思昆《计算机学报》2007,30(4):680-685

面向嵌入式系统的编译器,往往需要同时考虑目标代码的性能、大小和功耗等相互冲突的目标.ARM双指令集处理器,在具备通常的32位ARM指令集基础上,还支持一个缩减的16位Thumb指令集,因而为代码优化提供了多个目标之间折衷的机会.由于同一个程序的Thumb代码比相应的ARM代码执行更多的指令,因此虽然前者常比后者占用更少的存储空间,但消耗更多的运行时间.针对这种现象,文中建议一个混合演化算法,通过把程序的不同部分有选择地编译成ARM或Thumb指令集代码,使得可灵活地权衡目标代码大小和运行时间.文中的方法基于遗传算法和关键事件禁忌搜索相融合,后者用来局部搜索.指令选择以函数为单位,从对程序动态行为的profiling分析求得程序运行时间.实验结果表明,文中的技术可有效地、灵活地权衡目标代码大小和性能,并且适用于其它的双指令集处理器. 相似文献

17.

基于RISC-V的卷积神经网络专用指令集处理器

廖汉松吴朝晖李斌《计算机工程》2021,47(7):196-204

针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器.通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,提高终端设备能效.在此过程中,配置CNN各层信息控制加速器进行分组运算,以适应不... 相似文献

18.

一种优化的众核处理器核级冗余拓扑重构算法

杨力覃志东肖芳雄王绍宇《计算机工程》2015,(5)

现有的行波列借拓扑重构算法是基于分级优化思想,把整体优化问题分解为以失效核为中心的局部优化问题,通过局部搜索失效核重构的最优解来求解整体优化问题的最优解。但其在局部邻域进行的是单向搜索,易导致搜索到的解并不是局部最优解,或者前一单元依次占用下一单元最优解而导致连锁列借操作。针对上述情况,构造一种局部邻域双向搜索的优化行波列借算法,可使局部解更优,并避免连锁操作。实验结果表明,该算法在失效核数目较多的情况下,与原有行波列借算法相比,众核处理器虚拟拓扑结构性能明显提高。相似文献

19.

面向固件代码分析的虚拟指令集体系结构设计

下载免费PDF全文

赵远曾光裕王炜崔晨高洪博《计算机工程》2012,38(9):271-274

传统虚拟指令集体系结构不能同时满足简单性和高效性的要求。为此,提出一种面向固件代码分析的虚拟指令集体系结构构造方法。设计多目标固件代码分析平台,在可配置虚拟硬件结构的基础上,获取最小完备指令集,并说明扩展虚拟指令集的方法。实验结果表明,该方法能降低翻译代码膨胀率,目标指令模拟时间比传统方法减少19%~35%。相似文献