共查询到20条相似文献,搜索用时 62 毫秒
1.
异构机群系统中的最优处理机分配算法 总被引:6,自引:0,他引:6
在异构机群系统的并行计算中,处理机结点的划分及并行子任务在处理机上的映射将直接影响到应用程序并行计算的性能。本论文将通过对影响并行计算性能的主要参数的分析,提出一个基于人工智能A算法的最优处理机分配算法,为高性能的异构机群系统并行计算提供理论支持。 相似文献
2.
异构并行工作站机群系统的性能评价指标 总被引:4,自引:1,他引:4
文中在对矩阵乘法进行实验研究的基础上,分析了异构性对工作站机群系统性能的影响,描述了异构性的数学模型,扩展了加速比和效率等性能指标的定义,使之能同时适用于同构,异构两种并行系统的性能评价。 相似文献
3.
处理机分配是数据并行语言编译系统的一项重要技术,原因是高效使用大规模并行计算机的关键在于将程序中的计算尽可能均匀地分布到各个处理机上去执行,并且将程序中的数据按照使通信量尽可能少的原则分布存放在各个节点上,而处理机分配直接影响着数据分布和并行循环这代分布的效果。文章讨论处理机分配的原则,给出了一个高效的处理机分配算法。 相似文献
4.
本文介绍了一个适用于并行Prolog系统的处理机分配算法,利用群调度,通过将空闪处理机有选择地分配给适当的任务。实现了处理机间的负载平衡,并获得高的加速比。 相似文献
5.
6.
异构机群系统上基于多轮分配方式的近似串匹配并行算法 总被引:1,自引:0,他引:1
在给定正文串分配轮数的前提下,考虑处理机节点具有不同计算速度、不同通信能力的情形,根据从处理机是否允许重叠执行计算和通信操作,提出异构机群计算环境下的最优正文串多轮分配策略;同时提出一种周期性的正文串多轮分配策略并给出了相应的正文串多轮分配的闭合解,此策略可以求出最优的分配轮数.实验结果表明,正文串多轮分配策略比正文串单轮分配策略大大缩短了近似串匹配并行处理的时间,并且在正文串多轮分配策略中,当近似串匹配应用的规模较小时,分配轮数比参与近似串匹配并行处理的从处理机数更能影响近似串匹配并行处理的完成时间,反之,从处理机数对近似串匹配并行处理的完成时间影响更大. 相似文献
7.
文中介绍了一种新型的高性能网络接口(HPNI)的设计与实现,HPNI网络接口通过一个表直接出硬件对通信缓冲区进行维护,可以直接将消息数据从应用空间输入/输出到网络,从而支持真正意义上的0考贝通信协议,通过提供用户层网络访问接口,重叠通信与计算等手段,该接口取得了很高的通信性能,其中测量的应用程序之间16字节消息的传递延迟不到3μs,最大持续通信带宽可达40MB/s。 相似文献
8.
机群技术的快速发展,使得充分利用现有网络和计算机资源建立机群系统以提供高性能计算能力成为可能。文章讨论了建立基于网络的机群系统并行计算环境的一些主要问题,如负载平衡、可视化监控等,并提出和实现了建立机群并行计算平台的一种解决方案。 相似文献
9.
10.
11.
常庆利 《自动化技术与应用》2009,28(1):67-69
传统的以手工命令行方式监测计算机集群各个节点的方法,不但效率低下,而且节点故障不能实时反映。在SAR(合成孔径雷达)地面站系统中,需要实时监测系统各个Linux工作站的状态,以便在任何一个节点故障的情况下,立即排除故障,保证系统的可靠运行。基于B/S结构实现的实时监测,具有界面统一,使用简单,易于维护;扩展性好,信息共享程度高等优点,已在工程应用中取得较好的效果。 相似文献
12.
13.
随着我国并行技术的快速发展,一种非常新颖的分布式并行计算技术一计算机集群技术受到了人们的广泛关注,并且有越来越多的人投入到对该技术的研究,本文就对一种通信处理器和集群设计以及相应的通信算法进行阐述 相似文献
14.
Some testing results on DAWINING-1000,Paragon and workstation cluster are described in this paper.On the home-made parallel system DAWNING-1000 with 32 computational processors,the practical performance of 1.1777 Gflops and 1.58 Gflops has been measured in solving a dense linear system and doing matrix multiplication,respectively .The scalability is also investigated.The importance of designing efficient parallel algorithms for evaluating parallel systems is emphasized. 相似文献
15.
计算机集群技术的计算环境与拓扑结构实现 总被引:1,自引:0,他引:1
针对传统计算机指令的串行执行方式,文中在系统阐述计算机集群技术发展的基础上,介绍了集群技术的一般拓扑结构和集群计算环境,并对计算机集群技术的发展作了相关的预测和展望。集群技术具有并行性和可扩展性,提高了计算机的性能价格比。 相似文献
16.
17.
从体数据集中生成等值面是体可视化的主要技术之一。当体数据集的数据量很大时,计算量也随之增大,单处理机的存储与计算能力难以胜任其可视化要求,基于并行与分布式计算环境设计并行可视化算法是有效的办法。本文基于工作站群机系统的PVM环境,设计并实现了一种有效的、从大型体数据集中生成等值面的并行算法。 相似文献
18.
MohammadReza HoseinyFarahabady Javid Taheri Albert Y. Zomaya Zahir Tari 《Concurrency and Computation》2023,35(17):e6799
Apache Storm is a distributed processing engine that can reliably process unbounded streams of data for real-time applications. While recent research activities mostly focused on devising a resource allocation and task scheduling algorithm to satisfy high performance or low latency requirements of Storm applications across a distributed and multi-core system, finding a solution that can optimize the energy consumption of running applications remains an important research question to be further explored. In this article, we present a controlling strategy for CPU throttling that continuously optimize the level of consumed energy of a Storm platform by adjusting the voltage and frequency of the CPU cores while running the assigned tasks under latency constraints defined by the end-users. The experimental results running over a Storm cluster with 4 physical nodes (total 24 cores) validates the effectiveness of proposed solution when running multiple compute-intensive operations. In particular, the proposed controller can keep the latency of analytic tasks, in terms of 99th latency percentile, within the quality of service requirement specified by the end-user while reducing the total energy consumption by 18% on average across the entire Storm platform. 相似文献
19.
Hironori Nakajo Akihiro Ichikawa Yukio Kaneda 《International journal of parallel programming》2000,28(2):179-194
In this paper, a fast serial link, Serial Transparent Asynchronous First-in First-out Link (STAFF-Link), is introduced. Using such links, we construct a parallel processing system based on a workstation cluster. The workstation cluster implements a distributed sharedmemory mechanism for inter-process communication using a software controlled cache using a STAFF-Link router board. The board has a chained multicast capability with which we have implemented efficient invalidation protocol based on Eager Release Consistency (ERC) model in the DSM system. Performance results on several application programs from the SPLASH2 benchmark suites have been measured. 相似文献
20.
网络工作站以其低价高效的计算环境和快速可靠的服务被人们广泛接受并应用于高性能计算。按其用户使用类型可把网络工作站分为专用网络和非专用网络,专用工作站具有相对结构和管理简单,易于扩展等特点,非专用工作站具有充分利用计算机资源的特点,但管理较复杂。文中提出一种非专用网络计算的性能预测数学模型,它包括单个工作站系统的利用和同构机群系统的分布式服务。通过这个计算模型可从机器利用率,连续工作服务速率,并行任务分配等方面对并行任务完成时间进行预测。它为非专用网络环境的任务调度提供有价值的参考。 相似文献