首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
ARM Compute Library是一类针对ARM Cortex-A系列CPU处理器和ARM Mali系列GPU特定优化的软件算法函数库,内部实现了卷积滤波器、卷积神经网络等算法,并且使用Cortex-A CPU NEON、Mali GPU的SIMD技术加速算法运行。RISC-V指令集作为一种开源的指令集,目前发布了相对稳定的SIMD指令集版本,并且C-SKY开源了支持v0.7.1 intrinsics的GCC和QEMU。在这些基础上,本文尝试将ARM Compute Library函数库移植至支持RISC V向量指令集,其中函数移植的核心思想是在不修改源文件的前提下,通过编写一个头文件,用宏定义把ARM NEON向量类型接口逐一替换成RISC-V intrinsics中定义的向量类型和向量函数接口。  相似文献   

2.
介绍了嵌入式系统领域中的常用RISC微处理器——ARM处理器的ARM指令集与Thumb指令集,分析了应用程序的ARM代码与Thumb代码的各自的优势与不足,研究了生成高密度、执行效率高的混合代码的方法。  相似文献   

3.
引言 目前,在嵌入式处理器芯片中,以ARM7为核心的处理器是应用较多的一种。它具有多种工作模式,并且支持两种不同的指令集(标准32位ARM指令集和16位Thumb指令集)。μC/OS-II是专为嵌入式应用设计的抢占式、多任务实时操作系统,可用于各类8位、16位和32位单片机或DSP。  相似文献   

4.
ARM公司近日在美国加利福尼亚州圣荷西市召开的嵌入式处理器论坛会上发布了新的Thumb-2内核技术。Thumb-2内核技术是ARM体系结构的新指令集,将为多种嵌入式应用产品提供更高的性能、更低的功耗和更短的代码长度。Thumb-2内核技术以ARM现有的指令集体系结构为基础,具有对现有软件和开发工具链的完全兼容性。  相似文献   

5.
面向嵌入式系统的编译器,往往需要同时考虑目标代码的性能、大小和功耗等相互冲突的目标.ARM双指令集处理器,在具备通常的32位ARM指令集基础上,还支持一个缩减的16位Thumb指令集,因而为代码优化提供了多个目标之间折衷的机会.由于同一个程序的Thumb代码比相应的ARM代码执行更多的指令,因此虽然前者常比后者占用更少的存储空间,但消耗更多的运行时间.针对这种现象,文中建议一个混合演化算法,通过把程序的不同部分有选择地编译成ARM或Thumb指令集代码,使得可灵活地权衡目标代码大小和运行时间.文中的方法基于遗传算法和关键事件禁忌搜索相融合,后者用来局部搜索.指令选择以函数为单位,从对程序动态行为的profiling分析求得程序运行时间.实验结果表明,文中的技术可有效地、灵活地权衡目标代码大小和性能,并且适用于其它的双指令集处理器.  相似文献   

6.
在分析ARM指令集的寻址方式、寄存器个数、指令周期数等特征的基础上,考虑三级流水线对指令集能耗特征的影响,提出一种层次分类能耗测量方法。实验结果验证了该方法的有效性,得出指令集能耗与电流值和指令周期数的乘积呈正比,减少指令周期数能降低指令集能耗,并且3种应用程序用例在仿真平台HMSim的测量值与W90P710实际目标板的能耗值相接近,绝对误差在10%以内。  相似文献   

7.
ARM 7是ARM通用32位嵌入式微处理器家族的成员之一,ARM 7的精简指令集体系结构非常适合于移植嵌入式操作系统,该移植通过深入了解ARM 7体系结构和os原理,并选择适当的编译器和对uc-osⅡ嵌入式操作系统的相关文件进行设置后,即能在ARM 7上运行uc-osⅡ。  相似文献   

8.
基于ARM7的嵌入式操作系统uc-osⅡ的移植   总被引:2,自引:0,他引:2  
ARM7是ARM通用32位嵌入式微处理器家族的成员之一,ARM7的精简指令集体系结构非常适合于移植嵌入式操作系统,该移植通过深入了解ARM7体系结构和OS原理,并选择适当的编译器和对uc-osⅡ嵌入式操作系统的相关文件进行设置后,即能在ARM7上运行uc-osⅡ。  相似文献   

9.
ARM-Linux嵌入式语音终端   总被引:1,自引:0,他引:1  
基于ARM体系构架和嵌入式Linux操作系统构建了算法平台的硬件和软件结构,并在该平台移植了G.729语音编解码算法。通过对软件优化设计以及采用基于ARM指令集的算法优化策略,对G.729编解码器进行优化,提高了系统运行速度。  相似文献   

10.
缩减指令集计算机(RISC)在单位晶体管性能比上胜过常规的复杂指令集计算机(CISC)。英国Acorn计算机有限公司专门致力于RISC技术研究,并于1985年推出ARM计算机系统。本文简要地介绍该系统的设计思想。  相似文献   

11.
美国NI公司近日与ARM公司共同发布了应用于ARM微处理器上的NI LabVIEW嵌入式模块。它是Lab VIEW图形化系统设计平台的延伸,直接适用ARM 7^TM,ARM9^TM和Cortex^TM-M3微处理控制器系列产品。该模块是第一款由两家公司共同合作下,结合Lab VIEW的易操作性和ARM微处理器性能的产品。ARM是行业内主要的32位嵌入式精简指令集(RISC)处理器供应商.目前占有超过75%的市场份额以及超过100亿的ARM核设备。  相似文献   

12.
基于ARM V8架构的VecOp向量算法库,提出一种基础向量算法在ARM V8平台上实现和优化的方案。从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARM V8平台上的性能,以实现VecOp算法库在ARM V8平台上的优化。实验结果表明,该方案在ARM V8计算平台上实现的向量算法库性能提升可达到10%~300%。  相似文献   

13.
针对基于ARM9系列的处理器内核的WiMAX终端SoC,构建了一个软硬件协同仿真环境。连接ARM926ejs处理器内核的仿真模型和SoC的RTL模型,利用仿真模型支持的ARM指令集的特性运行WiMAX终端SoC中的MAC层firmware程序,实现了SoC软硬件的同步调试,有效的提高了系统集成和验证的效率,有效地缩短了系统开发时间。  相似文献   

14.
指令集模拟器是计算机体系结构研究和SoC软硬件协同设计的重要工具,模拟器的性能和灵活性是影响设计和验证效率的重要因素。解释型指令集模拟器具有很好的灵活性,在操作系统等涉及到自修改代码的模拟中具有不可替代的作用。该文给出了一个高性能解释型指令集模拟器的设计,它具有很高的模拟精度和很好的灵活性;同时指令集模拟器采用了动态译码缓存等优化技术,使其具有很高的模拟性能。以ARM7指令集模拟器为实例,所提出的优化技术同样适用于其它现心RISC体系结构。  相似文献   

15.
崔轶 《程序员》2006,(2):87-89
无论是体系结构还是指令集,大家或多或少都应该对X86汇编有些了解,而对于嵌入式领域已被广泛采用的ARM处理器,了解的可能并不多。如果你有兴趣从事嵌入式方面的开发,那么了解一些RISC体系结构和ARM汇编的知  相似文献   

16.
采用RISC(Reduced Instruction Set Computer,精简指令集计算机)架构的32位ARM(Advanced RISC Machines)微控制器,具有低功耗(内核工作电压一般为1.8V)、高性能、运算速度快(一般以MIPS为单位)、执行效率高等优点。本文采用Atmel公司的ARM920T内核的32位ARM微控制器AT91RM9200,实现其最小应用系统的硬件设计和软件开发;完成系统的调试和仿真。  相似文献   

17.
针对传统ARM处理器算力低、不适用于实时性需求比较高的应用场景的问题,本文提出了一种基于ARM处理器的单指令多数据(Single Instruction Multiple Data, SIMD)指令集的轻量化卷积神经网络计算加速方法,并将该方法用于处理脑电信号(Electroencephalogram, EEG)来进行手术过程中麻醉深度监测.通过可学习步长量化的方法得到轻量化卷积神经网络,减少浮点数的运算量,极大地提高了网络速度.采用基于ARM处理器SIMD指令集的卷积加速器,各卷积层分别可加速几十倍、几百倍,甚至一万多倍.在Ultra 96-V2开发板上用ARM处理器实现整个网络的运算,在昆士兰大学生命体征公开数据集上的测试结果表明,仅需39.64ms就可以处理时间跨度为1s的EEG单通道信号,速度提高到原来的10.5倍,且功耗仅为0.1J,在提升速度的同时基本保持网络预测的准确率,能够很好地预测出麻醉深度.  相似文献   

18.
以ARM920T为内核的AT91RM9200是采用RISC(Reduced Instruction Set Computer,精简指令集计算机)架构的32位ARM(Advanced RISC Machines)微控制器,具有低功耗、高性能、执行速度快、执行效率高等特点。该文以AT91RM9200为平台,论述了boot loader文件的开发,并通过交叉编译和调试,完成了boot loader(即u-boot)文件的移植。  相似文献   

19.
ARM7TDMI-S在嵌入式系统中的Bootloader代码设计   总被引:7,自引:0,他引:7  
ARM7TDMI-S是ARM公司设计的一款32位精简指令集处理器内核,LPC210x系列是飞利浦半导体公司生产的基于ARM7TDMI-S内核的芯片。在嵌入式系统设计中,针对嵌入式处理器和操作系统的Bootloader代码的设计是一个难点。本文根据用LPC2106进行嵌入式系统设计的实际经验,总结出基于ARM7TDMI-S内核的嵌入式处理器芯片的Bootloader代码设计的一般流程;给出LPC2106芯片在基于μC/OS-II操作系统的嵌入式应用中,BootLoader程序的详细设计流程及其中的一些关键技术和代码。  相似文献   

20.
EMSIM是一款基于指令集的功耗模拟器,EMSIM模拟了嵌入式体系结构各个硬件单元以及指令的执行。本文重点分析了EMSIM对SA-110的MMU/Cache模拟所采用的数据结构和函数模型,并在借鉴Skyeye模拟MMU/Cache的基础上,提出了一种扩展EMSIM模拟MMU/Cache的方法,实现了EMSIM对ARM7100的MMU/Cache的模拟。扩展后的EMSIM能同时模拟SA-110和ARM7100的MMU/Cache。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号