共查询到20条相似文献,搜索用时 312 毫秒
1.
在大规模的Hadoop集群中,良好的任务调度策略对提高数据本地性、减小网络传输开销、减少作业执行时间以及提高集群的作业吞吐量都有着重要的影响。本文针对Hadoop架构中Reduce任务的数据本地性较低问题,提出了一种基于延迟调度策略的Reduce任务调度优化算法,通过提高Reduce任务的数据本地性来减少作业执行时间以及提高作业吞吐量,该算法在Hadoop架构的Early Shuffle阶段,使用多级延迟调度策略来提高Reduce任务的数据本地性。最后重写原生公平调度器代码实现了该调度算法,并与原生公平调度器进行了对比实验分析,实验结果表明该算法明显减少了作业执行时间,提高了集群的作业吞吐量。 相似文献
2.
《计算机科学》2014,(Z1)
Hadoop已成为研究云计算的基础平台,MapReduce是其大数据分布式处理的计算模型。针对异构集群下MapReduce数据分布、数据本地性、作业执行流程等问题,提出一种基于DAG的MapReduce调度算法。把集群中的节点按计算能力进行划分,将MapReduce作业转换成DAG模型,改进向上排序值计算方法,使其在异构集群中计算更精准、任务的优先级排序更合理。综合节点的计算能力与数据本地性及集群利用情况,选择合理的数据节点分配和执行任务,减少当前任务完成时间。实验表明,该算法能合理分布数据,有效提高数据本地性,减少通信开销,缩短整个作业集的调度长度,从而提高集群的利用率。 相似文献
3.
在Hadoop集群环境下本地性调度算法是提高数据本地性的算法。本地性调度算法的调度策略的本质是提高数据本地性,减少网络传输开销,避免阻塞。但是由于Map任务的完成时间不同,Reduce任务存在的等待现象影响了作业的平均完成时间,使得作业的完成时间增加,进而引起系统的性能参数不佳。因此提出在保留原算法数据本地性要求的基础上集成可抢占式的调度方法。在Reduce任务等待时,挂起该任务并释放资源给其他Map任务,当Map任务完成到一定程度后,重新调度Reduce任务。基于上述调度策略设计了集成抢占式策略的本地性调度。为了对改进的算法进行验证,通过实验对本地性调度算法和集成抢占式本地性调度算法进行比较。实验结果表明,在相同数据上,集成抢占式本地性调度算法的平均完成时间有明显的降低。 相似文献
4.
5.
6.
解慧娟 《数字社区&智能家居》2014,(14):3206-3208,3211
该文在Hadoop实现的MapReduce架构基础上,分析了现有的三种作业调度算法,针对当前算法没有考虑服务器负载状况和数据本地性差的缺点,提出了基于可变长度队列的公平调度算法(FSVQ),该算法分析了空闲节点率,并通过采取等待的办法满足考虑数据本地性。实验证明该算法可增加服务器集群的工作效率,减少网络延迟,具有实际的应用意义。 相似文献
7.
作为开源云计算平台的核心技术之一,Map Reduce作业处理框架及其作业调度算法,对整个系统的性能起着至关重要的作用,而数据本地性是衡量作业调度算法好坏的一个重要标准,首先本文介绍和分析了Map Reduce基本原理,Map Reduce作业处理机制和Map Reduce作业调度机制及其在数据本地性方面表现出的优缺点等相关内容。其次,针对原生作业调度算法在数据本地性考虑不周全的问题,结合数据预取技术的可行性与优势,通过引入资源预取技术设计并实现一种基于资源预取的Hadoop Map Reduce作业调度算法,使作业执行效率更高。 相似文献
8.
9.
10.
MapReduce是云计算中重要的批数据处理框架,多任务共享MapReduce机群并满足任务实时性要求是调度算法急需解决的问题。提出两阶段实时调度算法,将调度划分为任务间调度和任务内调度。对于任务间调度,使用抽样法和经验值法确定子任务执行时间,利用该参数建立资源分配模型,动态确定任务优先级进行调度;对于子任务使用延迟调度策略进行调度,保证计算的本地性。实验结果显示,两阶段实时调度算法相比公平调度算法和FIFO算法,在保证吞吐量的同时能够满足任务实时性要求。 相似文献
11.
一个基于全局竞标机制的网格调度系统 总被引:1,自引:0,他引:1
通过对性能驱动型网格调度系统的分析,指出了其不足之处,继而提出并实现了全局调度和本地调度相结合的基于全局竞标机制的网格调度系统.实验证明,该系统能够在用户指定的时间约束内完成作业,并获得较优的执行代价,降低作业的运行成本. 相似文献
12.
基于NOW的运行时增量式集中式调度(NRICS)及其实现 总被引:1,自引:0,他引:1
提出并实现了一种基于NOW的运行时增量式集中式调度(runtime incremental conccentrated scheduling on NOW,NRICS)方法,该方法具有以下特点:运行时调度、增量式调度、集中式调度、结点间并行式负载交互。NRICS中,在一个阶段中由于对各任务的粒度和各结点执行能力估计不足所造成的负载失衡将在下一个阶段中得到改进和纠正,从而使各结点的负载不断趋于平衡。该方法具有良好的可伸缩性,文末给出了部分实验结果。 相似文献
13.
14.
毛纺企业的纺纱车间生产调度问题是一种复杂的Flowshop调度问题,针对这类问题,
本文提出采用Flowshop复合代理体(FSCA)求解的方案,其中使用了GA算法.在讨论了FSCA
的结构、实现和详细调度算法的基础上,通过纺纱车间调度实例研究说明了使用FSCA解决Fl
owshop调度问题的有效性. 相似文献
15.
排班问题是现实生活中的常见问题.从国内某货航实际情况出发,提出了一种初步排班流程.首先采用线性规划建立班制,再依据班制用贪心算法构建班制串矩阵,以回溯方法将具体班填入班制串,进行微调后完成排班.实验表明了排班方法的合理性. 相似文献
16.
对密集计算网格的资源进行角色分类,采用了基于作业优先级和资源优先级的作业调度算法,设计和实现了网格作业管理模块,为用户提供了一个有效的网格资源的使用方法,实现了对网格资源的优化使用,为网格用户提供了更好的网格资源服务共享。 相似文献
17.
本文针对目前实时系统中优先级调度的不足,提出了一种新的定时调度的事务调度方法。该方法能以系统时钟的最小量度精确地实现事务的定时调度。它与传统的优先级调度方法结合使用,可以更好地满足事务的截止期。本文还讨论了实现该策略的一些问题。 相似文献
18.
针对热轧型钢企业生产计划调度的约束复杂、易延误交货期、寻求最优解困难等问题,提出生产计划调度系统的结构功能设计方案,选用改进的批决策批调度策略建立计划调度模型,并利用遗传算法求解生产调度计划。以某热轧型钢企业设计实现的制造执行系统为依托,研究生产计划调度系统的执行情况,通过不同的订单数据以及不同的计划编制方法进行模拟计算和结果比较,验证了该改进型批决策与批调度模型的解可降低设备调度、节省生产时间、减少交货延误,以此来指导热轧型钢的生产可切实提高企业生产效率。 相似文献
19.
大规模Web信息提取是面向Internet非规范知识处理中的一个典型问题.以网格计算框架为实现平台,设计了分层的网格应用系统架构,针对Web信息提取中链接分析和信息提取功能,描述了面向一般网格计算框架的资源调度与编程模型.最后结合Web信息提取系统的实验结果,给出了网格应用系统的评价标准. 相似文献
20.
本文首先介绍一种基于并行图重写模型的并行图重写机PGRM。在此基础上提出一种新的任务分布策略。目标是以基于多线程的负载分布策略,减少系统的通讯开销,缩短响应时间并且使派生的任务有合理的计算粒度。本文提出的策略是一种融合分布式与集中式两种控制机制的一种混合策略。实验测试结果表明这种分布策略在多TRANSPUTER构成的分布存储多机系统上具有高效性和实用性。 相似文献