共查询到20条相似文献,搜索用时 100 毫秒
1.
本文针对基于可配置处理器的异构多核结构,提出一种新的线程级动态调度模型。此类异构多核系统中每个核分别针对某一应用做指令集扩展,调度器通过线程、处理器核以及指令集间的映射关系,动态调度线程至适合的处理器核,从而在没有大幅增加芯片面积的前提下,达到与每个核都具有全扩展指令集相近似的加速比,此外该模型还可以有效减少编程模型的复杂度。 相似文献
2.
3.
4.
处理器向异构多核架构发展 总被引:1,自引:0,他引:1
2007年秋,在PC及服务器中占主流地位的x86处理器终于进入了4核时代。AMD公司的4核处理器在2007年9月上市,英特尔公司也预定在2007年内推出单芯片封装的4核产品。两家公司都明确表示未来将会提供集成8个CPU内核的处理器产品。但是,多核化只不过掀开了处理器内部架构变革的序幕,各厂商正在摸索新的道路。 相似文献
5.
现有的可重构分组密码实现结构中,专用指令处理器吞吐率不高,阵列结构资源利用率低、算法映射过程复杂.为此,设计了分组密码可重构异构多核并行处理架构RAMCA(Reconfigurable Asymmetrical Multi-Core Architecture),分析了典型SP(AES-128)、Feistel(SMS4)、L-M(IDEA)及MISTY(KASUMI)结构算法在RAMCA上的映射过程.在65nm CMOS工艺下完成了逻辑综合和功能仿真.实验表明,RAMCA工作频率可达到1GHz,面积约为1.13mm2,消除工艺影响后,对各分组密码算法的运算速度均高于现有专用指令处理器以及Celator、RCPA和BCORE等阵列结构密码处理系统. 相似文献
6.
要想充分利用并行工作的处理器的威力,软件必须能够处理并发性问题。本文介绍如何通过LabVIEW图形化开发平台有效优化多核处理器环境下的信号处理性能。 相似文献
7.
8.
1目的当前大型SOC(System on chip,系统芯片)设计当中,多核异构成为了一种趋势,一颗芯片里面往往会有多个不同架构的CPU或者DSP,同时这些SOC里面也会有很多不同的外设,比如DDR,视频类的输入输出接口,各种高速数据接口(比如USB、PCIE等),还有各种慢速的外设接口(比如SPI、UART、I2C、I2S等),除了这些接口,还有各种内部模块,如何让信息/事件/命令以及数据在这些模块以及接口之间顺畅的流动和传递,以及如何让这颗SOC能顺利的和外面的设备以及芯片通讯,这里面需要一个非常好的软件设计来统筹安排。 相似文献
9.
10.
11.
12.
Waqar Hussain Henry Hoffmann Tapani Ahonen Jari Nurmi 《Journal of Signal Processing Systems》2017,87(3):287-297
This paper presents an integrated self-aware computing model mitigating the power dissipation of a heterogeneous reconfigurable multicore architecture by dynamically scaling the operating frequency of each core. The power mitigation is achieved by equalizing the performance of all the cores for an uninterrupted exchange of data. The multicore platform consists of heterogeneous Coarse-Grained Reconfigurable Arrays (CGRAs) of application-specific sizes and a Reduced Instruction-Set Computing (RISC) core. The CGRAs and the RISC core are integrated with each other over a Network-on-Chip (NoC) of six nodes arranged in a topology of two rows and three columns. The RISC core constantly monitors and controls the performance of each CGRA accelerator by adjusting the operating frequencies unless the performance of all the CGRAs is optimally balanced over the platform. The CGRA cores on the platform are processing some of the most computationally-intensive signal processing algorithms while the RISC core establishes packet based synchronization between the cores for computation and communication. All the cores can access each other’s computational and memory resources while processing the kernels simultaneously and independently of each other. Besides general-purpose processing and overall platform supervision, the RISC processor manages performance equalization among all the cores which mitigates the overall dynamic power dissipation by 20.7 % for a proof-of-concept test. 相似文献
13.
Kondo H. Nakajima M. Masui N. Otani S. Okumura N. Takata Y. Nasu T. Takata H. Higuchi T. Sakugawa M. Fujiwara H. Ishida K. Ishimi K. Kaneko S. Itoh T. Sato M. Yamamoto O. Arimoto K. 《Solid-State Circuits, IEEE Journal of》2008,43(4):892-901
A multicore system-on-chip (SoC) has been developed for various applications (recognition, inference, measurement, control, and security) that require high-performance processing and low power consumption. This SoC integrates three types of synthesizable processors: eight CPUs (M32R), two multi-bank matrix processors (MBMX), and a controller (M32C). These processors operate at 1 GHz, 500 MHz, and 500 MHz, respectively. These three types of processors are interconnected on this chip with a high-bandwidth multi-layer system bus. The eight CPUs are connected to a common pipelined bus using a cache coherence mechanism. Additionally, a 512-kB L2 cache memory is shared by the eight CPUs to reduce internal bus traffic. A multi-bank matrix processor with 2-read/1-write calculation and background I/O operation has been adopted. The 1-GHz CPU is realized using a delay management network which consists of delay monitors that can be applied for any kind of application or process technology. Our configurable heterogeneous architecture with nine CPUs and two matrix processors reduces power consumption by 45%. 相似文献
14.
为解决单核处理器时钟频率难以提高、处理器功耗逐渐增加等问题,文中提出了一种新型异构多核处理器的设计方案.该结构中增加了B--Cache结构和C--Core控制器,这种新型异构多核处理器避免了流水线因分支预测失误而flush,提高了整个处理器执行效率. 相似文献
15.
本文首先论述了超常指令字VLIW和多核处理器体系结构,重点介绍了华威处理器的设计。该处理器是一款基于VLIW和SIMD体系结构的多核微处理器,本文重点对该处理器的体系结构、指令调度和编译优化技术进行了介绍,并给出了采用推断推测技术的优化结果。 相似文献
16.
提出了一种基于多核的防病毒引擎的设计模型,并根据此模型实现了一款包含防病毒引擎的防火墙,经过测试表明,此款多核防病毒引擎的实现与传统防病毒引擎相比性能优异,满足高性能网络安全的需要。该模型主要有以下几个特点:解决多核硬件本身的报文乱序的问题而造成的对AV引擎的影响,从而达到减少漏报的功能;在多核数据平面实现基于报文流的查找,不进行报文的拷贝而实现跨包查找病毒的功能。 相似文献
17.
Golander A. Weiss S. Ronen R. 《Circuits and Systems II: Express Briefs, IEEE Transactions on》2009,56(6):474-478
We introduce the difficulties in processing context switches, exceptions, and interrupts in DMR architectures. We propose ways to address these problems in a dynamic DMR (DDMR) architecture, providing methods that assure both cores detect the event, synchronize it to the same instruction, perform a secure context switch, run correct interrupt service routines, and avoid process termination. DDMR uses a time-division multiplexing (TDM) ring architecture to dynamically connect pairs of cores. We enhance this protocol to include the different message types required to handle interrupts and exceptions. We also propose a more efficient address-based, rather than TDM-based, ring architecture. 相似文献
18.
随着深度学习的快速发展,神经网络和深度学习算法已经广泛应用于图像处理。基于FPGA的神经网络加速设计,搭建了以快速特征嵌入的卷积结构(Caffe)框架、卷积神经网络为核心的物体识别系统,该系统使用Zynq-7000系列异构多核架构芯片实现。完成了神经网络模型与参数的移植、多层结构的神经网络构建、计算密集度分析以及硬件加速设计。结果表明,设计的基于异构多核平台的Caffe框架物体分类系统实现了物体的识别和分类,且识别速度远超传统CPU架构的识别速度,从而为后续的深入研究提供一种新思路。 相似文献
19.
在同密技术下进行ECMG硬件实现,相比于软件实现,该ECMG加密速度快、安全度高.将ECMG分为三大模块:加密、ECM包生成和ECMG与加扰器通信模块.利用FPGA实现前两大模块,在基于Nios Ⅱ的SOPC系统上实现通信模块,下载程序测试,结果表明该设计符合应用要求. 相似文献
20.
传统的安全管理框架缺少对底层数据的整合分析,不能形成有效的网络安全态势信息和风险评估,也不能满足用户对其扩展性和健壮性的要求。文中利用TMN(电信管理网)管理与受管资源分开的思路启发,提出了一种新的综合安全管理框架。新的框架在J2EE分布式架构平台加以实现,能够满足用户对综合安管系统扩展性、易用性和健壮性的需求。 相似文献