共查询到19条相似文献,搜索用时 109 毫秒
1.
作为一种互连技术,InfiniBand技术具有高带宽、低延时等许多优势,被认为是消除当前I/O架构性能瓶颈的一种新途径.InfiniBand子网实现了数十个到数百个节点间的高速互连与数据传输.目前,InfiniBand技术已在高性能计算领域得到广泛应用,正逐渐成为高性能计算互连的首选协议.基板管理实现对InfiniBa... 相似文献
2.
InfinBand是一种新型高性能互连技术,既可作为系统内部互连技术又可作为网络互连技术。目前,在直接支持InfiniBand接口的高端计算机系统问世之前,可为基于PCI/PC I-X体系结构的计算机系统设计InfiniBand通信接口卡,实现InfiniBand主机通道适配器HCA的功能,将现有计算机接入高性能InfiniBandSAN,或接入基于InfiniBand的 能集群系统。本文提出了一种高性能InfiniBand通信接口卡的设计方案,并对其关键实现技术进行了研究,介绍了InfinBand通信接口卡的功能部件及设计要点,以及通信接口卡的实现要点。 相似文献
3.
InfiniBand:一种新型的高速互连网络 总被引:4,自引:0,他引:4
随着计算能力向数据中心的集中,消除性能瓶颈和改进系统管理变得比以往更加重要。I/O子系统是造成这类问题的关键。InfiniBand被认为是可以消除当前I/O架构性能瓶颈的一种新的I/O技术。该文首先分析当前I/O系统的瓶颈问题,然后从IBA整体架构、层次结构、通信机制与VI架构、链路特性与服务质量等方面介绍了InfiniBand的具体情况,最后将Infiniband与其它一些高性能互连网络和标准进行了比较。 相似文献
4.
5.
6.
随着Internet数据中心的快速发展 ,基于传统PCI总线的网络服务器越来越难以胜任数据密集型应用的要求。采用InfiniBand体系结构 (IBA)的高性能网络服务器可以充分发挥InfiniBand结构的优势 ,改善系统的I/O吞吐能力。首先介绍了当前总线技术面临的巨大问题 ,随后对InfiniBand体系结构的基本概念进行了介绍 ,对其主要特点做了深入分析 ,并将InfiniBand技术与其它互连技术做了比较 ;最后 ,提出了一个利用现有InfiniBand产品构建高性能网络服务器的结构。 相似文献
7.
8.
9.
基于InfiniBand网络存储的研究与设计 总被引:2,自引:0,他引:2
本文介绍了传统的存储体系结构的缺陷以及网络存储的现状,并探讨一种新型I/O技术-InfiniBand,进而阐述基于InfiniBand的I/O体系结构的研究,以及IB模拟器的设计. 相似文献
10.
本文在分析了PC系统微机系统16位总线结构的基础上,设计并实现了两种16位I/O接口电路。 相似文献
11.
如何有效地解决I/O瓶颈问题,一直是高性能并行计算机有待研究解决的关键技术。我们提出了一种可伸缩分布共享并行I/O系统方案,并自行研制了结点控制器芯片和路由器芯片,研制了原型系统SDSP604。为实现系统的计算、通讯和I/O性能随着系统规模均衡扩展的目标,该系统基于CC-NUMA系统结构,采用了合理的分布共享并行I/O系统结构。 相似文献
12.
为了缓解I/O瓶颈问题,可以从应用程序、可扩展算法、编译器和语言、运行时库、操作系统和体系结构六方面展开研究。其中,I/O体系结构是所有技术途径的关键支撑。当前并行I/O性能分析缺乏科学的理论模型为I/O体系结构设计提供理论依据。本文针对并行计算机系统的可扩展性问题,研究了I/O负载对并行计算机系统可扩展性的影响,建立了I/O受限的并行加速比性能模型,对目前大规模并行计算机系统中三种常用I/O体系结构的可扩展性进行了分析;以此为理论依据,提出了一种面向高性能计算的可扩展并行I/O系统结构。同时,还提出了几种有效降低I/O操作服务时间的策略,从而达到增强系统可扩展性的目的,为后续研究奠定了基础。 相似文献
13.
14.
Godson-3 is the latest generation of Godson microprocessor family.It takes a scalable multi-core architecture with hardware support for accelerating applications including X86 emulation and signal processing.This paper introduces the system architecture of Godson-3 from various aspects including system scalabihty,organization of memory hierarchy, network-on-chip,inter-chip connection and I/O subsystem. 相似文献
15.
随着E级计算的屏障被打破,高性能计算已经迈入了新时代。为了满足日益增长的数据访问需求,新兴的技术和存储介质都被运用到了超级计算机中,这使得其架构变得日趋复杂,其性能异常和系统热点定位也变得十分困难。为此,设计并实现了一个面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统——Beacon+。该系统无需修改应用代码/脚本即可对每个应用的数据访问过程进行全路径实时监控与分析。通过在线+离线的压缩方法和分布式缓存/存储等机制,Beacon+在保证系统本身高扩展性、低开销的同时还可以持续稳定地提供I/O诊断服务。以神威新一代超级计算机为部署平台,通过I/O标准测试应用和实际应用证明了Beacon+的低开销和高准确性,以及I/O诊断的高效性。 相似文献
16.
Because it retrieves all instructions and data from a single memory, the von Neumann computer architecture has a fundamental speed limit. The scalable multicomputer architecture, which uses many microprocessors together to solve a single problem and can run at teraflop speeds, may be a solution. While teraflop processor technology is known, the scalable operating and I/O system technology necessary for those speeds are not known. The authors describe how Unix can be extended to scalable computing, permitting teraflop speeds and offering parallel computing to users unfamiliar with parallel programming. They designed this technology into the system software of the Ncube-2, the predecessor to Ncube's announced teraflop parallel computer. The authors describe the system in detail and provide some performance results 相似文献
17.
Portable image processing applications require an efficient, scalable platform with localized computing regions. This paper presents a new class of area I/O systolic architecture to exploit the physical data locality of planar data streams by processing data where it falls. A synthesis technique using dependence graphs, data partitioning, and computation mapping is developed to handle planar data streams and to systematically design arrays with area I/O. Simulation results show that the use of area I/O provides a 16 times speedup over systems with perimeter I/O. Performance comparisons for a set of signal processing algorithms show that systolic arrays that consider planar data streams in the design process are up to three times faster than traditional arrays 相似文献
18.
可扩展并行处理机系统有两个需要解决的问题:(1)多级互连网络的延迟;(2)吞吐能力;本文根据SPP体系结构的特点和实际应用的需要提出了解决这两个瓶颈问题的有效方法在前端服务器与共享存储器之间设计专用的并行I/O处理机作为系统I/O设备与SM/SSM的直接数据通路。 相似文献
19.
Server performance is one of the critical activities in the data grid environment. A large number of applications require access to huge volumes of data from grid servers. In this case, efficient, scalable and robust grid server which can deal with large file transfer concurrent is needed. In this paper, we analyze the bottleneck of our grid servers and introduce user-space I/O scheduling, zero copy and event-driven architecture in our grid server to improve the servers’ performance. The user-space I/O scheduling can save almost 50% I/O time in a huge number of small files transfer. Grid servers can elimination CPU consumptions between kernel and user space by zero copy and cut 63% times for context switches. Event-driven architecture will save 30% CPU usage to reach the best performance by thread-driven architecture. Optimization method combination of these three above are used in our grid servers, the full-load throughput of our system is 30% more than traditional solutions and only 60% CPU consumed compared with traditional solutions. 相似文献