共查询到20条相似文献,搜索用时 15 毫秒
1.
ARM Compute Library是一类针对ARM Cortex-A系列CPU处理器和ARM Mali系列GPU特定优化的软件算法函数库,内部实现了卷积滤波器、卷积神经网络等算法,并且使用Cortex-A CPU NEON、Mali GPU的SIMD技术加速算法运行。RISC-V指令集作为一种开源的指令集,目前发布了相对稳定的SIMD指令集版本,并且C-SKY开源了支持v0.7.1 intrinsics的GCC和QEMU。在这些基础上,本文尝试将ARM Compute Library函数库移植至支持RISC V向量指令集,其中函数移植的核心思想是在不修改源文件的前提下,通过编写一个头文件,用宏定义把ARM NEON向量类型接口逐一替换成RISC-V intrinsics中定义的向量类型和向量函数接口。 相似文献
2.
介绍了嵌入式系统领域中的常用RISC微处理器——ARM处理器的ARM指令集与Thumb指令集,分析了应用程序的ARM代码与Thumb代码的各自的优势与不足,研究了生成高密度、执行效率高的混合代码的方法。 相似文献
3.
引言
目前,在嵌入式处理器芯片中,以ARM7为核心的处理器是应用较多的一种。它具有多种工作模式,并且支持两种不同的指令集(标准32位ARM指令集和16位Thumb指令集)。μC/OS-II是专为嵌入式应用设计的抢占式、多任务实时操作系统,可用于各类8位、16位和32位单片机或DSP。 相似文献
4.
《单片机与嵌入式系统应用》2003,(8):68-68
ARM公司近日在美国加利福尼亚州圣荷西市召开的嵌入式处理器论坛会上发布了新的Thumb-2内核技术。Thumb-2内核技术是ARM体系结构的新指令集,将为多种嵌入式应用产品提供更高的性能、更低的功耗和更短的代码长度。Thumb-2内核技术以ARM现有的指令集体系结构为基础,具有对现有软件和开发工具链的完全兼容性。 相似文献
5.
面向嵌入式系统的编译器,往往需要同时考虑目标代码的性能、大小和功耗等相互冲突的目标.ARM双指令集处理器,在具备通常的32位ARM指令集基础上,还支持一个缩减的16位Thumb指令集,因而为代码优化提供了多个目标之间折衷的机会.由于同一个程序的Thumb代码比相应的ARM代码执行更多的指令,因此虽然前者常比后者占用更少的存储空间,但消耗更多的运行时间.针对这种现象,文中建议一个混合演化算法,通过把程序的不同部分有选择地编译成ARM或Thumb指令集代码,使得可灵活地权衡目标代码大小和运行时间.文中的方法基于遗传算法和关键事件禁忌搜索相融合,后者用来局部搜索.指令选择以函数为单位,从对程序动态行为的profiling分析求得程序运行时间.实验结果表明,文中的技术可有效地、灵活地权衡目标代码大小和性能,并且适用于其它的双指令集处理器. 相似文献
6.
7.
8.
9.
10.
缩减指令集计算机(RISC)在单位晶体管性能比上胜过常规的复杂指令集计算机(CISC)。英国Acorn计算机有限公司专门致力于RISC技术研究,并于1985年推出ARM计算机系统。本文简要地介绍该系统的设计思想。 相似文献
11.
《计算机测量与控制》2008,16(6)
美国NI公司近日与ARM公司共同发布了应用于ARM微处理器上的NI LabVIEW嵌入式模块。它是Lab VIEW图形化系统设计平台的延伸,直接适用ARM 7^TM,ARM9^TM和Cortex^TM-M3微处理控制器系列产品。该模块是第一款由两家公司共同合作下,结合Lab VIEW的易操作性和ARM微处理器性能的产品。ARM是行业内主要的32位嵌入式精简指令集(RISC)处理器供应商.目前占有超过75%的市场份额以及超过100亿的ARM核设备。 相似文献
12.
13.
针对基于ARM9系列的处理器内核的WiMAX终端SoC,构建了一个软硬件协同仿真环境。连接ARM926ejs处理器内核的仿真模型和SoC的RTL模型,利用仿真模型支持的ARM指令集的特性运行WiMAX终端SoC中的MAC层firmware程序,实现了SoC软硬件的同步调试,有效的提高了系统集成和验证的效率,有效地缩短了系统开发时间。 相似文献
14.
15.
无论是体系结构还是指令集,大家或多或少都应该对X86汇编有些了解,而对于嵌入式领域已被广泛采用的ARM处理器,了解的可能并不多。如果你有兴趣从事嵌入式方面的开发,那么了解一些RISC体系结构和ARM汇编的知 相似文献
16.
17.
针对传统ARM处理器算力低、不适用于实时性需求比较高的应用场景的问题,本文提出了一种基于ARM处理器的单指令多数据(Single Instruction Multiple Data, SIMD)指令集的轻量化卷积神经网络计算加速方法,并将该方法用于处理脑电信号(Electroencephalogram, EEG)来进行手术过程中麻醉深度监测.通过可学习步长量化的方法得到轻量化卷积神经网络,减少浮点数的运算量,极大地提高了网络速度.采用基于ARM处理器SIMD指令集的卷积加速器,各卷积层分别可加速几十倍、几百倍,甚至一万多倍.在Ultra 96-V2开发板上用ARM处理器实现整个网络的运算,在昆士兰大学生命体征公开数据集上的测试结果表明,仅需39.64ms就可以处理时间跨度为1s的EEG单通道信号,速度提高到原来的10.5倍,且功耗仅为0.1J,在提升速度的同时基本保持网络预测的准确率,能够很好地预测出麻醉深度. 相似文献
18.
以ARM920T为内核的AT91RM9200是采用RISC(Reduced Instruction Set Computer,精简指令集计算机)架构的32位ARM(Advanced RISC Machines)微控制器,具有低功耗、高性能、执行速度快、执行效率高等特点。该文以AT91RM9200为平台,论述了boot loader文件的开发,并通过交叉编译和调试,完成了boot loader(即u-boot)文件的移植。 相似文献
19.
ARM7TDMI-S在嵌入式系统中的Bootloader代码设计 总被引:7,自引:0,他引:7
ARM7TDMI-S是ARM公司设计的一款32位精简指令集处理器内核,LPC210x系列是飞利浦半导体公司生产的基于ARM7TDMI-S内核的芯片。在嵌入式系统设计中,针对嵌入式处理器和操作系统的Bootloader代码的设计是一个难点。本文根据用LPC2106进行嵌入式系统设计的实际经验,总结出基于ARM7TDMI-S内核的嵌入式处理器芯片的Bootloader代码设计的一般流程;给出LPC2106芯片在基于μC/OS-II操作系统的嵌入式应用中,BootLoader程序的详细设计流程及其中的一些关键技术和代码。 相似文献
20.
EMSIM是一款基于指令集的功耗模拟器,EMSIM模拟了嵌入式体系结构各个硬件单元以及指令的执行。本文重点分析了EMSIM对SA-110的MMU/Cache模拟所采用的数据结构和函数模型,并在借鉴Skyeye模拟MMU/Cache的基础上,提出了一种扩展EMSIM模拟MMU/Cache的方法,实现了EMSIM对ARM7100的MMU/Cache的模拟。扩展后的EMSIM能同时模拟SA-110和ARM7100的MMU/Cache。 相似文献