共查询到19条相似文献,搜索用时 296 毫秒
1.
基于HPL测试的集群系统性能分析与优化 总被引:1,自引:0,他引:1
集群系统以很高的性价比和良好的可扩展性而成为当今高性能研究的一大新熟点,如何评价与优化集群系统的特性也成为一个很关键的问题。本文通过采用全世界TOP500计算机排名所用的HPL基准测试,对集群的浮点运算性能进行评测和分析,根据在集群系统上进行的HPL基准测试的结果分析总结了影响其整体性能的重要因素,并对这些方面一一给出具体的分析,提出了针对集群系统具有实际意义和研究价值的优化方向和优化方法。 相似文献
2.
为了提高集群效率,需要根据集群节点的性能来进行集群的数据部署和任务调度。在异构集群中,节点性能存在很大差异,如何评价节点的性能非常具有挑战性。可以使用基准测试来评价节点的性能,而不同的基准测试对节点评价的角度不尽相同。PageRank算法被谷歌用来对网站进行排名,现在它也被应用于评价书籍的影响力或用户行为等等。提出一种新颖的基于PageRank的节点性能评价算法,以充分利用不同基准测试的评价结果。首先对每个节点使用LINPACK、NPB、IOzone等主流基准测试进行评价;然后采用PageRank算法处理每个基准测试的执行结果,从而得到节点的性能。为了使用PageRank算法,建立了1个图模型,并计算了性能向量和概率转移矩阵。该算法具有计算复杂度低、综合评价效果好等优点。 相似文献
3.
4.
5.
6.
7.
网络性能基准测系统体系结构研究 总被引:1,自引:0,他引:1
基准测试系统是技术发展成熟的标志,网络基准测试系统发展的滞后已经成为阻碍网络发展的决定性因素;针对网络基准测试系统的功能和应用,分别对硬件平台和软件平台进行了分析,提出了实用的网络性能基准测试系统框架体系结构。 相似文献
8.
9.
基于比较策略的嵌入式系统性能基准测试研究 总被引:4,自引:1,他引:3
嵌入式系统受成本、功耗、芯片体积和开发周期等多种因素的制约,其性能往往难以满足应用需求,充分发挥嵌入式系统的潜能对嵌入式系统设计尤为重要。为此,需要对嵌入式系统进行性能基准测试,指导嵌入式系统设计的技术选型和决策,在满足应用需求的前提下,达到最佳性能/价格比。该文分析了嵌入式系统性能基准测试的基本原理和性能指标,介绍了几种常用的嵌入式系统性能评测基准及其适用范围,提出了一种运用对比策略进行嵌入式系统性能测试的测试方法和测试环境的构成,实现了一种嵌入式性能测试工具,并对相关的嵌入式系统及构件进行了性能测试。最后对嵌入式系统性能基准测试研究存在的主要问题进行了评价。 相似文献
10.
作为深度学习领域中最具有影响力的网络结构之一,卷积神经网络朝着更深更复杂的方向发展,对硬件计算能力提出了更高的要求,随之出现了神经网络专用处理器.为了对这类处理器进行客观比较,并指导软硬件优化设计,本文针对卷积神经网络提出了宏基准测试程序和微基准测试程序.其中,宏基准测试程序包含主流的卷积神经网络模型,用于处理器性能的多方位评估和对比;微基准测试程序包含卷积神经网络中的核心网络层,用于细粒度定位性能瓶颈并指导优化.为了准确描述这套基准测试程序在真实硬件平台上的性能表现,本文选取了I/O等待延迟、跨节点通信延迟和CPU利用率3大系统性能评测指标以及IPC、分支预测、资源竞争和访存表现等微架构性能评测指标.基于评测结果,本文为处理器的硬件设计与架构改进提出了可靠建议. 相似文献
11.
12.
网络通信系统是机群的一个重要组成部分,也是影响机群整机处理效率的关键因素.随着单个结点计算能力的增强,网络通信能力也需要相应地提高.一种提高网络通信能力的方法是引入多个网卡同时进行消息发送,即并行通信.通常,并行通信是基于RMA机制实现的,对于小于17KB的消息,由于RMA机制的握手过程使得并行通信性能的提高很有限.提出了基于智能网卡支持的并行通信协议.该协议将消息重组所需的握手过程下移到网卡上实现,从而减少了握手开销,扩展了并行通信的范围.实验数据表明,与基于RMA机制的并行协议相比,该协议提高了3KB-17KB消息段的通信性能;对应用程序,如FT程序,该协议将其执行时间减少了9.4%,而基于RMA机制的并行协议只减少了7.8%.最后分析了限制并行通信性能提高的主要因素. 相似文献
13.
14.
合作缓存机制是集群系统提高整体性能的一种有效方法,其利用高速网络将各个结点的缓存进行合作管理与访问,大幅度提高了缓存的命中率.但传统的合作缓存技术没有考虑到广为应用的高效用户层通信机制的特点.提出一种新的用户层通信与合作缓存技术相融合的缓存机制——集群统一缓存.这一机制充分利用了用户层通信的特点,包括协议精简、零拷贝、虚拟内存映射通信(VMMC)技术等,将缓存与结点通信相融合,减少了集群系统应用程序IO模块的层次与复杂度,提高了系统性能.同时这一机制也顺应了IO子系统日益独立化的发展趋势.该技术已经应用于自行开发的面向对象的Internet服务存储平台——TODS上,具有高效、扩展性好与软件设计简单等特点. 相似文献
15.
In previous works, the agent communication always takes place randomly through the whole agents distributed area, and all agents are treated equally in the communication process. However, the real communication is always imbalanced: communication in some places of the system may be very busy and the communication resources are insufficient, whereas in other places the communication may be very idle and the communication resources are redundant. To make up the shortage of related works, this paper presents a cluster partition-based communication model for multiagents. In the presented model, agents are divided into some clusters according to their communication frequencies; in each cluster, one agent is set to be hub-agent which carries the information of other agents within the cluster. With the presented model, the communication costs within the same cluster is lower than the one among different clusters because agents have closer distances within the same cluster; moreover, many real communication processes may take place within clusters since the clusters are partitioned according to the communication frequencies among agents. Therefore, the communication time and costs can be reduced by adopting our model. Finally, the advantage of our model is proved by a series of experiments. 相似文献
16.
基于高速通信协议的COSMOS机群文件系统性能研究 总被引:4,自引:0,他引:4
作为曙光3000超级服务器的重要组成部分,COSMOS机群文件系统对机群文件系统协议,结构及性能优化等问题进行全面深入的探讨,首先描述了基于曙光3000机群高速通协议BCL-3的COSMOS文件系统的实现,然后引入并发带宽利用率,描述了通信与I/O对机群文件系统性能影响程序,最后介绍了有关性能实验并对实验结果作出解释。 相似文献
17.
18.
19.
通过对基于MPI编程模型实现的开源有限元计算分析软件在多核集群计算平台中的程序性能的分析,找出程序瓶颈及其原因,实现了基于MPI编程模型的并行程序在多核计算环境中的性能优化。根据程序性能瓶颈的分析,提出了基于MPI/OpenMP混合并行编程模型的大规模线性/非线性方程组求解和多线程多进程同时进行消息通信的两种程序性能优化方案。不同计算规模的实验结果表明,在多核集群计算平台中,MPI/OpenMP混合编程模型实现的大规模非线性方程组求解器相对于单纯基于MPI编程模型实现的并行程序,其性能有2倍到3倍的提升;多线程多进程同时消息传递的优化方案虽然对程序能够起到性能优化作用,但是对解决程序消息通信瓶颈的问题不是最好的方法。两个方案总体性能分析结果表明,基于MPI/OpenMP混合编程模型实现的并行程序,在多核集群计算平台中能够更好地发挥硬件系统的计算能力。 相似文献