首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
异构机群系统中的最优处理机分配算法   总被引:6,自引:0,他引:6  
在异构机群系统的并行计算中,处理机结点的划分及并行子任务在处理机上的映射将直接影响到应用程序并行计算的性能。本论文将通过对影响并行计算性能的主要参数的分析,提出一个基于人工智能A算法的最优处理机分配算法,为高性能的异构机群系统并行计算提供理论支持。  相似文献   

2.
异构并行工作站机群系统的性能评价指标   总被引:4,自引:1,他引:4  
文中在对矩阵乘法进行实验研究的基础上,分析了异构性对工作站机群系统性能的影响,描述了异构性的数学模型,扩展了加速比和效率等性能指标的定义,使之能同时适用于同构,异构两种并行系统的性能评价。  相似文献   

3.
处理机分配是数据并行语言编译系统的一项重要技术,原因是高效使用大规模并行计算机的关键在于将程序中的计算尽可能均匀地分布到各个处理机上去执行,并且将程序中的数据按照使通信量尽可能少的原则分布存放在各个节点上,而处理机分配直接影响着数据分布和并行循环这代分布的效果。文章讨论处理机分配的原则,给出了一个高效的处理机分配算法。  相似文献   

4.
陶杰  鞠九滨 《计算机学报》1997,20(3):245-250
本文介绍了一个适用于并行Prolog系统的处理机分配算法,利用群调度,通过将空闪处理机有选择地分配给适当的任务。实现了处理机间的负载平衡,并获得高的加速比。  相似文献   

5.
程锦松 《微机发展》1996,6(4):35-37
本文讨论在分布式系统中当相邻的处理机不能同时工作时的处理机调度算法.  相似文献   

6.
异构机群系统上基于多轮分配方式的近似串匹配并行算法   总被引:1,自引:0,他引:1  
在给定正文串分配轮数的前提下,考虑处理机节点具有不同计算速度、不同通信能力的情形,根据从处理机是否允许重叠执行计算和通信操作,提出异构机群计算环境下的最优正文串多轮分配策略;同时提出一种周期性的正文串多轮分配策略并给出了相应的正文串多轮分配的闭合解,此策略可以求出最优的分配轮数.实验结果表明,正文串多轮分配策略比正文串单轮分配策略大大缩短了近似串匹配并行处理的时间,并且在正文串多轮分配策略中,当近似串匹配应用的规模较小时,分配轮数比参与近似串匹配并行处理的从处理机数更能影响近似串匹配并行处理的完成时间,反之,从处理机数对近似串匹配并行处理的完成时间影响更大.  相似文献   

7.
HPNI:一种新型的机群系统网络接口   总被引:3,自引:0,他引:3       下载免费PDF全文
文中介绍了一种新型的高性能网络接口(HPNI)的设计与实现,HPNI网络接口通过一个表直接出硬件对通信缓冲区进行维护,可以直接将消息数据从应用空间输入/输出到网络,从而支持真正意义上的0考贝通信协议,通过提供用户层网络访问接口,重叠通信与计算等手段,该接口取得了很高的通信性能,其中测量的应用程序之间16字节消息的传递延迟不到3μs,最大持续通信带宽可达40MB/s。  相似文献   

8.
机群技术的快速发展,使得充分利用现有网络和计算机资源建立机群系统以提供高性能计算能力成为可能。文章讨论了建立基于网络的机群系统并行计算环境的一些主要问题,如负载平衡、可视化监控等,并提出和实现了建立机群并行计算平台的一种解决方案。  相似文献   

9.
在机群系统中结点分配策略根据一定的原则为作业确定运行结点是提高系统性能的关键。通过对机群结点分配策略的研究,作者发现当前基于负载平衡自适应的结点分配策略为并行作业选择负载最轻的结点,这不利于系统性能的充分发挥。作者提出了一种新的自适应负载平衡结点分配算法:受限负载平衡结点分配。  相似文献   

10.
探讨了多指令流多数据流图像并行处理拓扑结构,设计了一种具有柔性结构的图像并行处理机。分析比较了柔性图像并行处理机与典型图像并行处理机在结构和性能方面的差异,给出了一种基于TI公司C6000系列DSP的柔性图像并行处理机的实现方案。分析和实现结果表明,柔性图像并行处理机适应能力强,便于调整、扩展和升级。  相似文献   

11.
传统的以手工命令行方式监测计算机集群各个节点的方法,不但效率低下,而且节点故障不能实时反映。在SAR(合成孔径雷达)地面站系统中,需要实时监测系统各个Linux工作站的状态,以便在任何一个节点故障的情况下,立即排除故障,保证系统的可靠运行。基于B/S结构实现的实时监测,具有界面统一,使用简单,易于维护;扩展性好,信息共享程度高等优点,已在工程应用中取得较好的效果。  相似文献   

12.
魏帅  赵荣彩  单征  毛艳 《计算机工程》2008,34(12):102-104
从网络处理器的体系结构入手,在线程和微引擎层次上对IXP系列网络处理器的并行环境进行抽象分析,在线程方面阐述了顺序和非顺序情况下不同的编程方法及其对应的效率和吞吐量,在微引擎方面以获得最大的吞吐量为目标给出最优的微引擎分配模型。针对IPv4路由器这种应用进行求解,当其采用1rx3pr1qm1sc2tx的分配方案时系统吞吐量最大,达到4 670.47 Mbp/s。  相似文献   

13.
随着我国并行技术的快速发展,一种非常新颖的分布式并行计算技术一计算机集群技术受到了人们的广泛关注,并且有越来越多的人投入到对该技术的研究,本文就对一种通信处理器和集群设计以及相应的通信算法进行阐述  相似文献   

14.
  总被引:3,自引:0,他引:3  
Some testing results on DAWINING-1000,Paragon and workstation cluster are described in this paper.On the home-made parallel system DAWNING-1000 with 32 computational processors,the practical performance of 1.1777 Gflops and 1.58 Gflops has been measured in solving a dense linear system and doing matrix multiplication,respectively .The scalability is also investigated.The importance of designing efficient parallel algorithms for evaluating parallel systems is emphasized.  相似文献   

15.
计算机集群技术的计算环境与拓扑结构实现   总被引:1,自引:0,他引:1  
邵英  夏立 《微机发展》2003,13(6):98-100
针对传统计算机指令的串行执行方式,文中在系统阐述计算机集群技术发展的基础上,介绍了集群技术的一般拓扑结构和集群计算环境,并对计算机集群技术的发展作了相关的预测和展望。集群技术具有并行性和可扩展性,提高了计算机的性能价格比。  相似文献   

16.
信息系统风险灰色评估方法   总被引:3,自引:0,他引:3  
信息系统风险评估的数据不够充分,传统的风险评估方法难以采纳。为评估信息系统风险,通过分析风险与安全事件的关系,以安全事件的组成元素构建信息系统风险的评估指标,并依据标准进行风险的分级量化。在此基础上,运用灰色评估方法,建立信息系统风险多层灰色评估模型,描述了信息系统的风险灰色综合评估过程,并进行了实例计算。该方法是信息系统风险评估的一种有效方法。  相似文献   

17.
从体数据集中生成等值面是体可视化的主要技术之一。当体数据集的数据量很大时,计算量也随之增大,单处理机的存储与计算能力难以胜任其可视化要求,基于并行与分布式计算环境设计并行可视化算法是有效的办法。本文基于工作站群机系统的PVM环境,设计并实现了一种有效的、从大型体数据集中生成等值面的并行算法。  相似文献   

18.
    
Apache Storm is a distributed processing engine that can reliably process unbounded streams of data for real-time applications. While recent research activities mostly focused on devising a resource allocation and task scheduling algorithm to satisfy high performance or low latency requirements of Storm applications across a distributed and multi-core system, finding a solution that can optimize the energy consumption of running applications remains an important research question to be further explored. In this article, we present a controlling strategy for CPU throttling that continuously optimize the level of consumed energy of a Storm platform by adjusting the voltage and frequency of the CPU cores while running the assigned tasks under latency constraints defined by the end-users. The experimental results running over a Storm cluster with 4 physical nodes (total 24 cores) validates the effectiveness of proposed solution when running multiple compute-intensive operations. In particular, the proposed controller can keep the latency of analytic tasks, in terms of 99th latency percentile, within the quality of service requirement specified by the end-user while reducing the total energy consumption by 18% on average across the entire Storm platform.  相似文献   

19.
In this paper, a fast serial link, Serial Transparent Asynchronous First-in First-out Link (STAFF-Link), is introduced. Using such links, we construct a parallel processing system based on a workstation cluster. The workstation cluster implements a distributed sharedmemory mechanism for inter-process communication using a software controlled cache using a STAFF-Link router board. The board has a chained multicast capability with which we have implemented efficient invalidation protocol based on Eager Release Consistency (ERC) model in the DSM system. Performance results on several application programs from the SPLASH2 benchmark suites have been measured.  相似文献   

20.
网络工作站以其低价高效的计算环境和快速可靠的服务被人们广泛接受并应用于高性能计算。按其用户使用类型可把网络工作站分为专用网络和非专用网络,专用工作站具有相对结构和管理简单,易于扩展等特点,非专用工作站具有充分利用计算机资源的特点,但管理较复杂。文中提出一种非专用网络计算的性能预测数学模型,它包括单个工作站系统的利用和同构机群系统的分布式服务。通过这个计算模型可从机器利用率,连续工作服务速率,并行任务分配等方面对并行任务完成时间进行预测。它为非专用网络环境的任务调度提供有价值的参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号