首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随着信息技术的发展,工业嵌入式系统的功能规模迅速地增长,大大增加了硬件成本,需缩减硬件成本以提高利润.同时,为满足系统的功能安全约束,对任务和消息进行整体调度的问题也亟待解决.以硬件成本缩减为目标,设计了硬件成本缩减方案,定义了任务到处理器映射、任务和任务、任务和消息等的时序约束关系,提出了基于整数线性规划的硬件成本缩...  相似文献   

2.
移动云计算可以将任务从移动设备计算卸载至云端以增强设备计算能力,而如何实现能效计算卸载机制是当前的主要挑战。为了解决该问题,以降低移动设备能耗和应用完成时间为目标,将计算卸载问题形式化为满足任务顺序与截止时间约束的能效代价最小化问题,并提出一种动态能效感知计算卸载算法。算法由三个子算法组成:计算卸载选择、时钟频率控制及传输功率分配。实验结果表明,通过局部计算时优化调整移动设备CPU时钟频率,以及云端计算时自适应分配传输功率,新算法可以有效降低应用执行能效代价,同时确保满足约束条件,提高执行效率。  相似文献   

3.
云计算通常需要处理大量的计算任务,任务调度策略在决定云计算效率方面起着关键作用。如何合理地分配计算资源,有效地调度任务运行,使所有任务运行完成所需的时间较短、成本较小是个重要的问题。提出一种考虑时间-成本约束的遗传算法(TCGA),通过此算法调度产生的结果不仅能使任务完成所需的时间较短,而且成本较小。通过实验,将TCGA与考虑时间约束的遗传算法(TGA)、考虑成本约束的遗传算法(CGA)进行比较,实验结果表明,该算法是云计算中一种有效的任务调度算法。  相似文献   

4.
陈乃金 《计算机应用》2012,32(1):158-162
针对可重构计算硬件任务划分通信成本较小化的问题,提出了一种基于深度优先贪婪搜索划分(DFGSP)算法。首先,从待调度的就绪队列中取出队首任务,在某一硬件面积约束下,按深度优先搜索(DFS)方式扫描一个计算密集型任务转换来的有向无环图(DAG),逐个划入满足要求的节点;然后,一遇到不满足面积要求的任务节点时,就计算当前划分模块间输出边数(可量化为通信成本);最后,跳过当前不满足要求的任务节点,继续搜索该点之后处于就绪状态的节点,当搜索到满足要求的点时,按加入该点后不增加当前划分块间输出边数和尽可能填满可重构运算阵列的原则进行。实验结果表明,与现有的簇划分(CBP)、簇层次敏感两种划分算法相比,提出的算法获得了最小划分模块数和平均跨模块间I/O边数最小的均值,通过实际验证,算法显著地改善了硬件任务的划分效果,而且运行开销没有明显增加。  相似文献   

5.
近年来, AR/VR、在线游戏、4K/8K超高清视频等计算密集且时延敏感型应用不断涌现,而部分移动设备受自身硬件条件的限制,无法在时延要求内完成此类应用的计算,且运行此类应用会带来巨大的能耗,降低移动设备的续航能力.为了解决这一问题,本文提出了一种Wi-Fi网络多AP (access point)协作场景下边缘计算卸载和资源分配方案.首先,通过遗传算法确定用户的任务卸载决策.随后,利用匈牙利算法为进行任务卸载的用户分配通信资源.最后,根据任务处理时延限制,为进行任务卸载的用户分配边缘服务器计算资源,使其满足任务处理时延限制要求.仿真结果表明,所提出的任务卸载与资源分配方案能够在满足任务处理时延限制的前提下有效降低移动设备的能耗.  相似文献   

6.
移动边缘计算(MEC)系统中,因本地计算能力和电池能量不足,终端设备可以决定是否将延迟敏感性任务卸载到边缘节点中执行。针对卸载过程中用户任务随机产生且系统资源动态变化问题,提出了一种基于异步奖励的深度确定性策略梯度(asynchronous reward deep deterministic policy gradient,ARDDPG)算法。不同于传统独立任务资源分配采用顺序等待执行的策略,该算法在任务产生的时隙即可执行资源分配,不必等待上一个任务执行完毕,以异步模式获取任务计算奖励。ARDDPG算法在时延约束下联合优化了任务卸载决策、动态带宽分配和计算资源分配,并通过深度确定性策略梯度训练神经网络来探索最佳优化性能。仿真结果表明,与随机策略、基线策略和DQN算法相比,ARDDPG算法在不同时延约束和任务生成率下有效降低了任务丢弃率和系统的时延和能耗。  相似文献   

7.
传统网络架构部署下的边缘服务器难以满足大规模用户设备的接入和通信质量要求。为增加网络容量,提高频谱利用率,通过密集化基站的部署,构建一种面向超密集边缘计算网络的任务卸载优化模型。面对信道状态的变化、移动设备的动态需求以及服务器和频谱资源的有限性对任务卸载带来的挑战,结合任务类型和服务器的计算能力,并考虑信道状态变化、移动设备的动态需求以及干扰约束对卸载策略的影响,提出一种基于自适应模拟退火遗传(AGASA)算法的任务卸载方法,在满足任务截止期限的同时,对任务卸载能耗进行优化。同时,为得到最优上传功率,采用黄金分割算法解决功率控制问题,从而降低传输能耗。实验结果表明,AGASA算法在信道状态变化时可保证通信质量和计算效率,相比混合遗传粒子群算法,能够在满足截止期约束的同时使卸载能耗降低15.56%。  相似文献   

8.
边缘计算为资源受限的物联网IoT设备扩展计算资源、增强存储容量,可以改善IoT应用程序的执行性能。在IoT环境中,大多数应用都将以分布式架构的形式部署在各站点中,站点之间需要协作完成任务。为了解决物联网环境中多站点协同计算的代价优化问题,提出了一种基于遗传算法的多站点协同计算卸载算法GAMCCO。该算法将应用程序抽象为任务依赖关系图模型,分析各任务之间的依赖关系,将多站点协同计算卸载的问题建模为代价模型,并利用遗传算法寻找最小代价的卸载方案。实验与评估结果表明,所提出的GAMCCO算法可以有效减少IoT应用的时延,同时降低终端设备的能耗。  相似文献   

9.
卷积神经网络在诸多领域已经取得超出人类的成绩.但是,随着模型存储开销和计算复杂性的不断增加,限制处理单元和内存单元之间数据交换的"内存墙"问题阻碍了其在诸如边缘计算和物联网等资源受限环境中的部署.基于阻变存储的硬件加速器由于具有高集成度和低功耗等优势,被广泛应用于加速矩阵-向量乘运算,但是其不适合进行32b浮点数计算,...  相似文献   

10.
随机任务在云计算平台中能耗的优化管理方法   总被引:5,自引:0,他引:5  
谭一鸣  曾国荪  王伟 《软件学报》2012,23(2):266-278
针对云计算系统在运行过程中由于计算节点空闲而产生大量空闲能耗,以及由于不匹配任务调度而产生大量“奢侈”能耗的能耗浪费问题,提出一种通过任务调度方式的能耗优化管理方法.首先,用排队模型对云计算系统进行建模,分析云计算系统的平均响应时间和平均功率,建立云计算系统的能耗模型.然后提出基于大服务强度和小执行能耗的任务调度策略,分别针对空闲能耗和“奢侈”能耗进行优化控制.基于该调度策略,设计满足性能约束的最小期望执行能耗调度算法ME3PC(minimum expectation execution energy with performance constraints).实验结果表明,该算法在保证执行性能的前提下,可大幅度降低云计算系统的能耗开销.  相似文献   

11.
一种面向动态可重构计算的调度算法   总被引:4,自引:1,他引:3  
硬件任务的调度是影响动态可重构系统性能的关键因素之一.提出一种任务间最小空隙调度算法MGS(minimum gap scheduling algorithm),该算法借助任务投影和调度代价函数,采用二维时空坐标系协调各硬件任务占用的芯片资源和执行时间,可有效减少系统资源浪费,提高并行度.MGS算法策略直观,调度开销小,且同时适用于实时和非实时场合.仿真实验表明,与已有算法相比,MGS算法不但降低了硬件任务的调度时间开销,而且具有更高的芯片利用率和更低的任务拒绝率.  相似文献   

12.
软硬件划分是软硬件协同设计的关键环节,划分的结果直接影响目标系统的设计质量。因此,对于一个给定的应用程序,为了使得目标系统快速执行且成本低廉,合理的划分策略十分重要。由于单个任务具有多种不同的硬件实现方式,与传统的单一硬件实现方式的软硬件划分问题相比,多选择的软硬件划分更能客观地反映现实应用。这导致问题的求解更具挑战性,它们已被证明是NP完全问题。基于多核处理器片上系统并针对任务图为二叉树的应用,建立了多选择软硬件划分问题的计算模型,并提出了解决该问题的动态规划算法。实验结果表明,当问题规模适中时,所提动态规划算法能够有效地获得精确解,并展示了算法的计算能力与硬件面积限制之间的关系。  相似文献   

13.
可重构系统中硬件任务布局布线算法研究   总被引:1,自引:1,他引:0  
韩国栋  肖庆辉  张帆 《计算机科学》2011,38(11):291-295
可重构计算系统中,二维可重构硬件任务的布局布线问题是影响系统资源利用率的重要因素。在异质化的可重构器件和任务模型基础上,对可重构硬件任务进行了适当分类,并提出一种能够对多类型可重构硬件任务同时布局布线的算法DRS-TCW。实验表明,该算法能够有效提高可重构器件的资源利用率和任务布线连通率。  相似文献   

14.
Real quantum computing technologies have different restrictions and constraints which need to be considered during circuit synthesis. In certain technologies, only physically adjacent qubits can interact, which restricts their realizations to only linear nearest neighbor (LNN) architecture. In this work, we formulate the line ordering problem in LNN architecture as task assignment problem to find a mapping (permutation) between task graph and processor graph with minimum cost. We propose two different approaches, a greedy heuristic and a meta-heuristic algorithm based on Harmony Search to solve the task assignment problem. Experimental results show that our algorithms were able to reduce the quantum cost of benchmark circuits by approximately 30 % on average. Moreover, the proposed algorithms were compared to one recently proposed ordering algorithm and were found to further improve the cost by approximately 16 %.  相似文献   

15.
由于存在诸如CPU运算速度慢,电池容量低等问题,智能移动设备本身无法执行计算需求大的应用程序,需要借助边缘计算技术来降低程序对移动设备硬件的要求。然而将部分计算任务从移动设备传输给边缘服务器,会带来额外的传输能耗和服务器计算能耗。综合考虑影响移动设备和服务器,以及数据传输能耗值的四个因素,即移动设备的计算速度,下载数据功耗,数据卸载百分比和剩余网络带宽占,提出一种基于分层学习的粒子群算法,优化每台移动设备对于这四个参数的取值,更合理分配计算资源使得总能耗最小。对计算资源建模时,还考虑了最大能耗、计算周期、存储、带宽和延迟约束条件。与其他算法进行对比实验发现,通过分层学习优化的粒子群算法,能更快速地获得满足约束条件具有更低能耗的资源调度最优解。  相似文献   

16.
许驰  唐紫萱  金曦  夏长清 《控制与决策》2024,39(7):2457-2464
针对多终端、多边缘服务器场景下异构工业任务的端边协同处理问题,提出一种基于李雅普诺夫优化和深度强化学习的多任务端边迁移算法.首先,以联合优化任务迁移决策、迁移比例和传输功率为目标,充分考虑计算频率、传输功率、长期能耗和任务截止期等约束,构建系统长期平均开销最小化问题;由于问题中长期目标及约束中变量在不同时隙相互耦合,难以求解,基于李雅普诺夫优化理论,将长期平均开销最小化问题解耦为独立时隙的策略优化问题;通过马尔可夫决策过程建模,并采用双层竞争深度神经网络架构,提出基于深度强化学习的多任务迁移算法.实验结果表明,所提算法能够稳定收敛,并在长期能耗约束和任务截止期要求下有效降低系统长期平均开销.  相似文献   

17.
刘金石  Manzoor Ahmed  林青 《计算机工程》2022,48(11):284-290+298
城市交通智能化和通信技术的进步会产生大量基于车辆的应用,但目前车辆有限的计算资源无法满足车辆应用的计算需求与延迟性约束。车辆云(VC)可以高效地调度资源,从而显著降低任务请求的延迟与传输成本。针对VC环境下任务卸载与计算资源分配问题,提出一个考虑异质车辆和异质任务的计计资源分配算法。对到达的任务构建M/M/1队列模型与计算模型,并定义一个效用函数以最大化系统整体效用。针对环境中车辆地理分布的高度动态系统变化,提出基于双时间尺度的二次资源分配机制(SRA),使用两个不同时间尺度的资源分配决策动作,对其分别构建部分可观测马尔可夫决策过程。两个决策动作通过执行各自的策略获得的奖励进行连接,将问题建模为两层计算资源分配问题。在此基础上提出基于二次资源分配机制的多智能体算法SRA-QMix求解最优策略。仿真结果表明,与深度确定性策略梯度算法对比,该算法的整体效用值和任务完成率分别提高了70%、6%,对于QMix和MADDPG算法分别应用SRA后的任务完成率分别提高了13%与15%,可适用于动态的计算资源分配环境。  相似文献   

18.
人工智能的飞速发展对高性能计算提出了更高的要求,异构计算环境下任务调度问题一直是高性能计算中的关键问题.本文提出一种基于优先队列划分的调度算法(PQDSA),该算法根据DAG(有向无循环图)任务集的入口节点数量确定优先队列数,通过任务的通信开销和计算开销划分任务队列,进而将关键节点任务分配给合适的队列,以产生效果较佳的任务调度队列,从而提高任务间的并行性,降低任务集的完工时间.与此同时,进一步基于插入策略将任务调度到处理器上,使任务调度更加高效地执行.PQDSA算法可以减少任务间的时间消耗,提高处理器的调度效率.通过与两个经典算法的性能对比,实验结果表明本文提出的PQDSA算法在任务完工时间和调度效率方面都要明显优于对比的算法.  相似文献   

19.
随着汽车电子市场的快速发展,汽车控制器的电子控制单元(ECU)已越来越多,对ECU的功能测试也变得日趋复杂。为解决车载ECU功能测试,研究了基于控制器局域网络(CAN)的ECU自动测试方法。以NI公司的软硬件为开发平台、CAN总线为通信平台搭建测试系统与被测ECU形成闭环结构。通过CAN总线传输测试信息,可实现对同型号ECU的批量测试。此系统采用了新的测试方法来降低测试误差,并支持ECU的流水线测试,大大降低了测试的复杂度,减少了工作量。同时,在完善仿真信号产生模块和测试模块用例库后,也能适用于其他类型ECU的功能测试。  相似文献   

20.
There are many design challenges in the hardware-software co-design approach for performance improvement of data-intensive streaming applications with a general-purpose microprocessor and a hardware accelerator. These design challenges are mainly to prevent hardware area fragmentation to increase resource utilization, to reduce hardware reconfiguration cost and to partition and schedule the tasks between the microprocessor and the hardware accelerator efficiently for performance improvement and power savings of the applications.In this paper a modular and block based hardware configuration architecture named memory-aware run-time reconfigurable embedded system (MARTRES) is proposed for efficient resource management and performance improvement of streaming applications. Subsequently we design a task placement algorithm named hierarchical best fit ascending (HBFA) algorithm to prove that MARTRES configuration architecture is very efficient in increased resource utilization and flexible in task mapping and power savings. The time complexity of HBFA algorithm is reduced to O(n) compared to traditional Best Fit (BF) algorithm’s time complexity of O(n2), when the quality of the placement solution by HBFA is better than that of BF algorithm. Finally we design an efficient task partitioning and scheduling algorithm named balanced partitioned and placement-aware partitioning and scheduling algorithm (BPASA). In BPASA we exploit the temporal parallelism in streaming applications to reduce reconfiguration cost of the hardware, while keeping in mind the required throughput of the output data. We balance the exploitation of spatial parallelism and temporal parallelism in streaming applications by considering the reconfiguration cost vs. the data transfer cost. The scheduler refers to the HBFA placement algorithm to check whether contiguous area on FPGA is available before scheduling the task for HW or for SW.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号