首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
应用于高性能计算领域的通用GPU拥有强大的并行计算能力,以通用GPU作为主处理器的数据分析系统相较于传统数据库能够提供更好的性能。在大数据场景下,如何根据CPU和GPU的资源在处理器之间合理分配工作负载是亟待解决的问题。提出了一种CPU GPU异构数据分析系统上的负载均衡处理策略。该策略采用流水线模型将工作负载分解,基于流水线设计了负载均衡模型,将工作负载合理分配至异构处理器,减少系统总执行时间开销,实现了性能提升。实验结果表明,提出的基于流水线的负载均衡模型能适应不同查询请求下的不同数据量场景,具有良好的性能。  相似文献   

2.
由于超长指令字处理器通常都有多级流水线和复杂的资源使用限制,如何准确地描述处理器的流水线模型,快速地判断是否存在资源冲突并不是个简单地任务。文章介绍GCC新引入的正则表达式语法的流水线描述机制。在将GCC移植到笔者所开发的SuperV芯片的过程中,利用该机制对SuperV芯片的流水线结构和资源使用限制进行详尽地描述,启动了GCC的指令级并行调度。通过并行调度,测试程序的性能提高了大约6%—35%。  相似文献   

3.
孟祥扬  林琦 《计算机应用》2015,35(4):991-995
针对MD5软件实现方法存在占用资源大、安全性差等缺点,提出了基于NetMagic平台的MD5硬件加速模型设计方案,并基于ModelSim和NetMagic平台对提出的非流水线与流水线硬件加速模型进行验证、分析。相比非流水线硬件加速模型,流水线硬件加速模型能提高MD5运算效率5倍,可用于网络处理器等硬件加密引擎,有效提高网络处理器等硬件设备的安全性和处理效率。  相似文献   

4.
众核处理器具有强大的并行处理能力,成为提升路由器转发性能的有效途径.基于众核处理器的数据包处理采用多级流水线结构,每个流水阶段的执行时间不同,要求分配不同的核数.已有的核资源均衡分配方法(equi-partition,EQUI)为每个流水阶段分配相同的核数,存在核资源浪费等缺点,限制了数据包处理性能.提出了一种众核处理器资源优化方法,即根据数据包的处理步骤将其划分成多个子阶段,通过统计各阶段的总执行时间,按执行时间比例分配给各个模块所需核数.与已有的EQUI相比,核资源最佳分配方法在数据包转发速率上提高了约20%.  相似文献   

5.
潘琢金  郑彩平  杨华 《计算机工程》2010,36(14):275-277
动态超标量处理器的性能取决于流水线各段资源的配置情况,通常认为资源越多对性能提升越有利。对流水线前端资源的分配进行研究,发现各类资源的合理搭配更重要,资源配置过多或搭配不当可能产生负面影响。分析各类资源的潜在互相干扰、影响性能的现象、过程及深层次原因,并给出一些参考建议。  相似文献   

6.
由成百上千处理器核构成的众核处理器在提供大量计算能力的同时,也对如何高效利用资源提出挑战;具有不同并行度的应用对处理器核资源有不同的需求,不合理的分配会造成资源浪费(分配过多)或者限制并行性开发(分配过少).针对众核结构上串行程序线程级推测执行面临的处理器核资源分配问题,提出一种基于硬件的推测执行能力监测和评估机制,设计三种线程级推测执行能力评估器;该评估器能够根据串行程序推测执行能力的动态变化,对应用分配的处理器核资源数量进行实时调整.实验结果表明,利用一个硬件开销极小的评估器对众核平台上串行程序的线程级推测执行进行资源分配指导,即可使性能和资源利用率达到有效的平衡.  相似文献   

7.
传统的流水线设计是以转移指令为中心的,大量逻辑资源被用于提高处理器转移预测的能力,以保证向流水线发射和执行部件提供充足的指令流。在阵列众核处理器中提出了一种以访存为中心的核心流水线设计。通过提高访存装载指令在流水线中的执行优先级,以及访存装载指令的预测执行机制,可以有效减少顺序流水线因访存延迟所带来的停顿,提高流水线性能和能效比。测试结果表明,以4KB容量的装载指令访存地址表为例,访存为中心的流水线设计可以带来8.6%的流水线性能提升和7%的流水线能效比提高。  相似文献   

8.
张浩  钱学海 《计算机工程》2008,34(3):102-104
主流处理器中采用的超标量流水线机制及高速缓存使得SMC操作需要特殊处理。该文基于对多种程序的SMC行为的分析和多种SMC冲突的解决方案的对比,设计了一种灵活高效的SMC解决方法。该方法对结构的复杂度及主流水线的性能的影响小,目前已被应用在支持CISC指令集的Godsonx处理器模型上。  相似文献   

9.
针对一种RISC/DSP结构处理器MediaDSP3201(MD32),给出了一种分布式数据转发机制设计策略,有效地避免了MD32在执行过程中不必要的流水线停顿,并通过“数据转发链模型”实现.此策略在考虑转发效率的同时,通过电路优化避免转发电路对流水级时延的影响,以提高处理器整体性能.最后以MPEG解码程序为例,说明该策略以较小的硬件成本(占MD32资源的3.7%)有效地降低了CPI值,比集中式数据转发机制的处理性能提高了36%.  相似文献   

10.
基于RISC-V标准指令集,提出一种六级流水线设计方法。首先,分析了流水线级数对处理器性能的影响,在经典五级流水线的基础上将流水线划分为6个阶段,缩短时延,提高主频。其次,为解决流水线中的冒险问题,采用定向前推和插入纵向气泡的方式处理数据冒险问题,使用流水线冲刷解决流水线中控制冒险问题。最后,在EDA工具中,采用RISC-V标准指令集对本设计进行仿真测试,并在FPGA上实现,运行时钟频率可达78.2 MHz。  相似文献   

11.
合同战术训练评估系统体系结构   总被引:1,自引:1,他引:0       下载免费PDF全文
在介绍合同战术训练评估需求分析、系统总体结构的基础上,研究了其中的演习结果评估子系统的框架和层次结构,横向上将其分为主框架、行动评估模块、算法插件3个部分,纵向上把它分为数据采集、数据处理、成绩报告3层,从而有效地降低了系统各组成部分间的耦合程度,并使系统能综合运用多样化的数据采集手段以及效能分析方法,具有一定的参考价值。  相似文献   

12.
In this paper, a processor allocation mechanism for NoC-based chip multiprocessors is presented. Processor allocation is a well-known problem in parallel computer systems and aims to allocate the processing nodes of a multiprocessor to different tasks of an input application at run time. The proposed mechanism targets optimizing the on-chip communication power/latency and relies on two procedures: processor allocation and task migration. Allocation is done by a fast heuristic algorithm to allocate the free processors to the tasks of an incoming application when a new application begins execution. The task-migration algorithm is activated when some application completes execution and frees up the allocated resources. Task migration uses the recently deallocated processors and tries to rearrange the current tasks in order to find a better mapping for them. The proposed method can also capture the dynamic traffic pattern of the network and perform task migration based on the current communication demands of the tasks. Consequently, task migration adapts the task mapping to the current network status. We adopt a non-contiguous processor allocation strategy in which the tasks of the input application are allowed to be mapped onto disjoint regions (groups of processors) of the network. We then use virtual point-to-point circuits, a state-of-the-art fast on-chip connection designed for network-on-chips, to virtually connect the disjoint regions and make the communication latency/power closer to the values offered by contiguous allocation schemes. The experimental results show considerable improvement over existing allocation mechanisms.  相似文献   

13.
同时多线程处理器中同时执行的线程共享处理器中的资源,而这些有限的共享资源在线程之间的分配状况将决定每个线程执行的性能和处理器的总体性能。如何根据不同类别共享资源的特性对它们进行合理有效分配成为同时多线程处理器研究的重要课题之一。本文对同时多线程处理器中各类共享资源的特性进行深入研究与分析,分析结果表明,队列类共享资源的分配方式对每个线程执行的性能和SMT处理器的总体性能具有至关重要的影响。因此,同时多线程处理器中共享资源分配的关键在于控制队列类共享资源的分配。  相似文献   

14.
许多领域都涉及资源分配问题,怎样合理的把各种有限的经济资源分配给企业内各生产部门,使得本企业在相对较低的成本投入下得到较大利润是每一个企业所追求的目标。于是就产生了如何分配以使工程目标或生产目的达到最优的问题。本文针对这一类资源分配问题,阐述了用动态规划方法和多段图方法的求解思想,并通过实例比较了两种算法。  相似文献   

15.
基于微观经济学方法的网络资源分配研究   总被引:8,自引:0,他引:8  
随着Internet应用迅猛发展,网络资源相对匮乏的问题日渐突出。如何合理分配有限的资源为不同服务质量需求的应用提供服务,提高资源使用效率,是亟等解决的问题。近年来,研究者把微观经济学方法引入网络资源分配领域,为这一领域的研究提出崭新的思路,具有重大意义。详细分析了基于微观经济学方法网络资源分配研究的最新进展,并指出当前研究存在的问题以及下一步研究的方向。  相似文献   

16.
基于服务部署的高可用模型及其可用性分配算法   总被引:1,自引:0,他引:1  
汤海鹰  许鲁 《计算机学报》2007,30(10):1731-1739
传统高可用系统存在可扩展性较差的问题.文中提出基于服务部署的高可用系统模型,利用对计算资源与存储资源的分离管理实现虚拟高可用服务节点,通过不同服务间共享冗余资源提高资源利用率,有效解决可扩展性问题.基于服务部署高可用系统的关键问题为如何根据服务可用性期望值和使用模式等合理分配资源.针对本系统可用性分配特点,文中提出了最适合冗余优先分配算法,基于结合费用与惩罚值的目标函数得到满足需求的相对最优解,实验证明此算法能较好地达到系统的实时服务部署要求.  相似文献   

17.
该文在假定的系统结构和编程模型之上,分析了几种已有的基于共享存储的多处理机系统的处理机分配方法及其缺陷,提出了一种改进的方法,并对其实现进行了探讨。  相似文献   

18.
Various contiguous and noncontiguous processor allocation policies have been proposed for mesh-connected multicomputers. Contiguous allocation suffers from high external processor fragmentation because it requires that the processors allocated to a parallel job be contiguous and have the same topology as the multicomputer. The goal of lifting the contiguity condition in noncontiguous allocation is reducing processor fragmentation. However, this can increase the communication overhead because the distances traversed by messages can be longer, and messages from different jobs can interfere with each other by competing for communication resources. The extra communication overhead depends on how the allocation request is partitioned and mapped to free processors. In this paper, we investigate a new class of noncontiguous allocation schemes for two-dimensional mesh-connected multicomputers. These schemes are different from previous ones in that request partitioning is based on the submeshes available for allocation. The available submeshes selected for allocation to a job are such that a high degree of contiguity among their processors is achieved. The proposed policies are compared to previous noncontiguous policies using detailed simulations, where several common communication patterns are considered. The results show that the proposed policies can reduce the communication overhead and improve performance substantially.  相似文献   

19.
论文主要考虑多用户的MIMO-OFDM问题,以使得各个用户更公平有效地分配网络资源。文章首先给出MIMO-OFDM模型,然后引入反映用户满意程度的效益函数,并给出在MIMO-OFDM模型下的效益函数具体形式。其次,进行资源分配,重点考虑OFDM的各个子载波该分配给哪个用户,以及总功率该如何分配给各个子载波,从而实现系统的最优化。最后,文章给出了仿真结果,并着重对仿真结果进行了详细的性能分析。  相似文献   

20.
基于云模型的网格资源分配策略   总被引:1,自引:1,他引:0  
网格是下一代的Internet,是目前网络研究的重点。网格资源分配是网格中非常重要的部分,而且网格资源有分布、异构、动态、由多个组织所拥有和具有不同的使用、访问及消费模型等特点,属于定性的范畴。传统的网格资源分配策略无法有效对定性的网格资源进行分配,容易形成网络瓶颈。云模型是定性定量间转换的不确定性模型,通过它能将定性的网格资源转换为定量的表达。因此笔者提出了一种新的网格资源分配策略,把云模型运用于网格资源分配,将定性的网格资源映射为定量的可细微变化的不同云滴,然后再配合目前研究相对比较成熟的算法或模型进行资源分配,实验表明新的策略能更准确地对网格资源进行评价并有效分配。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号