首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 334 毫秒
1.
随着嵌入式技术的不断发展,HMPU逐渐广泛应用于高性能计算领域.异构多核处理器,即具有两个或以上处理器内核的处理器,因其计算效率高,且可针对不同应用调整结构,其应用相当广泛.在具体应用中,多核处理器的不同处理器核之间需要进行大量的、频繁的数据交换,因此,处理器核间的通信效率严重影响处理器的性能.目前通过调查研究,异构多...  相似文献   

2.
目前多核架构已成为处理器的主流设计并成为各种多媒体应用的主流处理平台,而核间通信的效率是影响多核处理器性能的重要因素之一.提出了一种针对多媒体应用程序的核间通信的优化方法.该方法利用此类应用程序数据读取的规律性,通过在多核处理器上添加通信队列,实现只读数据的快速传递,从而提高多媒体应用程序的并行执行效率.实验表明使用通信队列对各种多媒体核心算法的性能都有普遍提高.同时,该方法具有良好的扩展性,当内核数目增加,通信队列所带来的好处也更加明显.  相似文献   

3.
随着单芯片上集成处理器内核数量的增加,在支持多核处理器的应用程序方面,核间通信变得更加重要.通过分析多核运行任务特点,根据处理核上运行任务功能的不同,将处理核分成两类:控制核和计算核.根据对核的分类,提出了一种新的核间通信模型,该模型提供了三种不同的通信通道.运用这三条通道,把应用程序的I/O部分从计算核迁移到控制核来提高多核的利用率,实验结果表明该方式有效提高核间协作以及核间通信的效率,提升处理器的利用率.  相似文献   

4.
近年来,多核处理器在嵌入式领域得到越来越广泛的应用,但多核间不可避免的通信开销阻碍了系统性能大幅提升,因此研究如何降低核间通信开销变得尤为重要. 针对同构多核平台上周期依赖任务,提出一种降低核间通信开销的任务调度算法并在该基础上进行优化,通过对部分任务预先调度一个周期,将周期内任务间的数据依赖转换成周期间的数据依赖,从而缩短调度长度,提高系统性能. 对以上算法进行仿真模拟,并分别在双核和四核平台上进行多组实验. 结果表明:提出的调度优化算法可以显著降低周期依赖任务核间通信开销,提高执行效率.  相似文献   

5.
陈虎  周鹏灵 《计算机应用》2023,(11):3517-3526
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代...  相似文献   

6.
随着嵌入式设备应用场景日趋复杂的变化,异构多核架构逐渐成为嵌入式处理器的主流架构.目前,多核处理器主要采用的单操作系统模式在实际应用中存在诸多局限性.为了充分发挥异构处理器的多核特性,针对异构处理器不同核部署相应的操作系统并实现多操作系统协同处理技术至关重要.本文对异构多核处理器(ARM+DSP)操作系统进行了研究,在异构多核平台上成功移植了嵌入式Linux和国产DSP实时操作系统ReWorks;为实现ReWorks与Linux操作系统协同处理,本文对核间通信的关键技术进行分析研究,并以TI公司的AM5718为例,设计了一系列多核异构通信组件.经测试,本文设计的异构通信组件实现了在ARM上对DSP核进行ReWorks操作系统和应用程序的动态加载、Linux与ReWorks核间消息收发、以及Linux与ReWorks的协同计算等功能.  相似文献   

7.
阵列众核处理器由于其较高的计算性能和能效比已经被广泛应用于高性能计算领域。而要构建未来高性能计算系统处理器必须解决严峻的"访存墙"挑战以及核心协同问题。通常的阵列处理器中,核心多采用单线程结构,以减少开销,但是对访存提出了较高的要求。在阵列众核处理器中,在单核心中引入硬件同时多线程技术,针对实验中一级指令缓存命中率随着线程数增加而显著降低的问题,提出了一种面向阵列众核处理器的冗余指令缓存存储结构,基于该结构,提出采用FIFO及类LRU替换策略。通过上述优化的高速缓存结构设计,经实验模拟,双线程整体指令Cache失效率降低了25.2%,整体CPI性能提升了30.2%。  相似文献   

8.
三维地震声波理论与计算方法是地质勘探研究的基础,通过分析不同介质中声波的传播特性,完成三维地震声波正演模拟。针对三维地震声波有限差分交错网格方程正演过程中存在数值计算大、内存消耗大等实际问题,提出了基于神威·太湖之光超级计算机系统中国产异构众核处理器(申威26010)的三维地震声波正演模拟编程模型,完成了基于处理器间的进程级并行基于计算核心间的线程级并行优化策略。研究了DMA(直接内存读取)通信方式,提出2.5D流水线任务划分、通信与计算的相互掩盖的多角度优化策略。实验结果表明,该策略有效缓解了带宽瓶颈,发挥了处理器强大的计算能力,解决了程序在申威26010异构众核处理器处理有限差分问题时,并行效率过低的问题。在大规模测试下,使用266240个计算核心,程序仍能够保持稳定的计算性能,达到5.5 GFlops的场值更新。  相似文献   

9.
近年来,随着半导体技术的发展以及应用多样化的需求,异构多核处理器已被广泛应用于高性能嵌入式系统中。这类系统面临的一个主要挑战就是如何在运行时对系统的可用资源(包括处理核等)进行管理分配从而满足系统及其所运行应用在性能和功耗等方面的需求。然而,虽然目前一些主流的资源管理技术在性能和/或功耗优化等方面取得了良好表现,但却经常对所设计的资源管理部件缺乏严格的可靠性保证,因此提出了一种基于离散控制器合成(DCS)的方法来对异构多核系统的在线资源管理策略进行自动、可靠的设计,即将形式化的、能够自动构造管理控制部件的DCS应用到异构多核系统的在线资源管理部件设计中。该方法通过采用形式化模型来描述异构系统的运行行为(例如如何为应用分配处理核),并将在线资源管理问题转换为一个面向某个系统管理目标(例如最大化应用性能)的DCS问题。在此基础上,通过现有的DCS工具对提出的方法进行了示例演示和验证,并对所使用DCS方法的可扩展性进行了评估。  相似文献   

10.
一种异构多核处理器嵌入式实时操作系统构架设计   总被引:2,自引:1,他引:2  
由于异构多核处理器和多处理器系统及同构多核处理器的构架存在很大差别,应用于多处理器系统的分布式结构以及应用于同构多核系统的主从式结构操作系统不能解决异构多核处理器的实时调度和效率问题。对异构多核处理器的特点及发展趋势进行了研究,提出了一种适用异构多核处理器的多主模式实时操作系统构架。这种构架将通信总线中的多主模式引入多核操作系统构架中,采用对称式结构及组件模式设计操作系统模型,使多核处理器中每个内核都可以作为主核实现对资源、任务的实时管理,提高系统性能,同时可以解决主从式操作系统存在的由于处理器核增多而带来的主内核不能满足系统性能要求的瓶颈问题。通过这种单一构架模型可以进行灵活配置,以适应不同结构及功能要求的处理器内核,降低操作系统开发难度。  相似文献   

11.
为了提高消息传递型多处理器的性能,优化处理器间的通信对于并行化编译器至关重要。介绍了建立在精确数组数据流分析基础上的通信优化技术。通过优化,减少了通信次数,降低了通信代价。最后通过一个实例说明,在一定计算划分下结合精确数据流分析实现通信比仅仅依据计算划分实现通信能更有效地减少通信量。  相似文献   

12.
TMS320C6678多核DSP的核间通信方法   总被引:5,自引:3,他引:5  
嵌入式应用中采用多处理系统所面临的主要难题是多处理器内核之间的通信。对Key-Stone架构TMS320C6678处理器的多核间通信机制进行研究,利用处理器间中断和核间通信寄存器,设计并实现了多核之间的通信。从系统的角度出发,设计与仿真了两种多核通信拓扑结构,并分析对比了性能。对设计多核DSP处理器的核间通信有一定的指导价值。  相似文献   

13.
作为新一代大数据流式计算框架,Heron忽略了任务实例之间不同通信方式的差异以及节点资源利用率不均衡的问题导致系统性能下降。针对这一问题,设计了节点资源限制模型、通信开销优化模型和实例数据流关系模型,并在此基础上提出了Heron环境下基于实例重分配的传输负载优化策略(transmission load optimization strategy based on instance reallocation in Heron,TLIR-Heron)。该策略包括节点资源限制算法和实例重分配算法,通过判定实例重分配条件并执行重分配算法将节点间数据流转换为节点内数据流,从而降低通信开销。实验结果表明,在三组拓扑测试下,TLIR-Heron相较于Heron默认调度策略能够降低节点间通信开销和系统的计算延迟,并提升了计算节点资源利用的均衡性。  相似文献   

14.
基于ARM11 MPCore的多核间通信机制研究   总被引:1,自引:0,他引:1  
嵌入式应用中采用SMP(对称多处理)系统所面临的主要难题是多处理器内核之间的通信.对 ARM11 MPCore 处理器的多核间通信机制进行研究,并结合 Linux-2.6.19 对这一通信机制的具体实现作深入分析,并在 RealView Emulation Baseboard 上面进行相应的验证.实验结果表明,多核间通信机制可以使多线程之间的交互时间减小为原来的16.7%,从而提升并行计算系统的性能.  相似文献   

15.
由于移动边缘计算网络在边缘位置部署,在多用户并发的情况下带宽资源优化策略容易出现高计算负荷,降低带宽资源优化的效果。为了解决这一问题,提出基于萤火虫算法的移动边缘计算网络带宽资源优化策略。在服务器之间数据连续传输的情况下,确定网络内用户分布情况,计算网络运行需要消耗的能量,利用萤火虫算法建立以带宽资源为中心的数学模型,以移动边缘计算网络的各项参数作为依据,对数学模型求解,得到最优解后,以用户最大收益为目标部署优化策略。实验结果表明:提出的基于萤火虫算法的带宽资源优化策略计算延迟小,网络带宽资源优化效能高,整体计算性能得到了明显提升。  相似文献   

16.
随机任务在云计算平台中能耗的优化管理方法   总被引:5,自引:0,他引:5  
谭一鸣  曾国荪  王伟 《软件学报》2012,23(2):266-278
针对云计算系统在运行过程中由于计算节点空闲而产生大量空闲能耗,以及由于不匹配任务调度而产生大量“奢侈”能耗的能耗浪费问题,提出一种通过任务调度方式的能耗优化管理方法.首先,用排队模型对云计算系统进行建模,分析云计算系统的平均响应时间和平均功率,建立云计算系统的能耗模型.然后提出基于大服务强度和小执行能耗的任务调度策略,分别针对空闲能耗和“奢侈”能耗进行优化控制.基于该调度策略,设计满足性能约束的最小期望执行能耗调度算法ME3PC(minimum expectation execution energy with performance constraints).实验结果表明,该算法在保证执行性能的前提下,可大幅度降低云计算系统的能耗开销.  相似文献   

17.
蒋筱斌  熊轶翔  张珩  武延军  赵琛 《软件学报》2023,34(4):1977-1996
现阶段,随着数据规模扩大化和结构多样化的趋势日益凸现,如何利用现代链路内链的异构多协处理器为大规模数据处理提供实时、可靠的并行运行时环境,已经成为高性能以及数据库领域的研究热点.利用多协处理器(GPU)设备的现代服务器(multi-GPU server)硬件架构环境,已经成为分析大规模、非规则性图数据的首选高性能平台.现有研究工作基于Multi-GPU服务器架构设计的图计算系统和算法(如广度优先遍历和最短路径算法),整体性能已显著优于多核CPU计算环境.然而,这类图计算系统中,多GPU协处理器间的图分块数据传输性能受限于PCI-E总线带宽和局部延迟,导致通过增加GPU设备数量无法达到整体系统性能的类线性增长趋势,甚至会出现严重的时延抖动,进而已无法满足大规模图并行计算系统的高可扩展性要求.经过一系列基准实验验证发现,现有系统存在如下两类缺陷:(1)现代GPU设备间数据通路的硬件架构发展日益更新(如NVLink-V1,NVLink-V2),其链路带宽和延迟得到大幅改进,然而现有系统受限于PCI-E总线进行数据分块通信,无法充分利用现代GPU链路资源(包括链路拓扑、连通性和路由);(2)在...  相似文献   

18.
黄光奇  李子木  周兴铭  窦勇 《计算机学报》2001,24(12):1318-1323
随着半导体工艺技术的飞速发展,单芯片多处理器(Single-Chip Multiprocessor,SCMP)结构将是一条提高处理器性能的有效途径。该文在分析SCMP结构的特点的基础上,提出了SCMP的一种结构实现:共享多端口数据Cache结构(Shared Multi-Ported Data Cache Architecture,SMPDCA).SMPDCA结构具有三个突出的优点:最小的通信延迟、没有Cache一致性维护开销和数据Cache命中率提高。模拟结果表明,与数据Cache私有的结构相比,SMPDCA结构的煅出优点使得应用程序的性能得到了明显的提高,特别是对于改善处理器之间的通信与交互比较多的应用程序的性能具有最为明显的效果。  相似文献   

19.
多接入边缘计算(multi-access edge computing,MEC)技术将计算和存储资源下沉到网络边缘,可大幅提高物联网(Internet of things,IoT)系统的计算能力和实时性。然而,MEC往往面临计算需求增长和能量受限的约束,高效的计算卸载及能耗优化机制是MEC技术中重要的研究领域。为保证计算效率的同时最大程度提升计算过程中的能效,提出了两级边缘节点(edge nodes,ENs)中继网络模型,并设计了一种计算资源及信道资源联合优化的最优能耗卸载策略算法(optimal energy consumption algorithm,OECA)。将MEC中的能效建模为0-1背包问题;以最小化系统总体能耗为目标,系统自适应地选择计算模式和分配无线信道资源;在Python环境下仿真验证了算法性能。仿真结果表明,相比于基于有向无环图的卸载策略算法(directed acyclic graph algorithm,DAGA),OECA可将网络容量提升18.3%,能耗缩减13.1%。  相似文献   

20.
由于受到系统资源和实时性的限制,对于嵌入式实时系统的安全扩展很难延用通用计算机系统的安全设计方法,因此需要对其进行专门的研究。为了在确保实时性的前提下使嵌入式实时系统的安全性达到最优,本文提出了一套完整的安全设计方法,包括安全任务图模型和安全评估模型,在此基础上,又提出了一种基于整数线性规划的安全策略优化生成方法ILPOS。该安全策略优化生成方法同时解决了安全算法选择和实时可调度性检测两方面的问题,克服了一般分阶段优化方法的不足,从而充分地利用系统可用时间来实现安全扩展。仿真实验结果表明,与传统的启发式安全设计算法相比,ILPOS方法在各种实时性约束条件下都能有效地提高系统的安全性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号