首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
作为一种互连技术,InfiniBand技术具有高带宽、低延时等许多优势,被认为是消除当前I/O架构性能瓶颈的一种新途径.InfiniBand子网实现了数十个到数百个节点间的高速互连与数据传输.目前,InfiniBand技术已在高性能计算领域得到广泛应用,正逐渐成为高性能计算互连的首选协议.基板管理实现对InfiniBa...  相似文献   

2.
InfinBand是一种新型高性能互连技术,既可作为系统内部互连技术又可作为网络互连技术。目前,在直接支持InfiniBand接口的高端计算机系统问世之前,可为基于PCI/PC I-X体系结构的计算机系统设计InfiniBand通信接口卡,实现InfiniBand主机通道适配器HCA的功能,将现有计算机接入高性能InfiniBandSAN,或接入基于InfiniBand的 能集群系统。本文提出了一种高性能InfiniBand通信接口卡的设计方案,并对其关键实现技术进行了研究,介绍了InfinBand通信接口卡的功能部件及设计要点,以及通信接口卡的实现要点。  相似文献   

3.
InfiniBand:一种新型的高速互连网络   总被引:4,自引:0,他引:4  
随着计算能力向数据中心的集中,消除性能瓶颈和改进系统管理变得比以往更加重要。I/O子系统是造成这类问题的关键。InfiniBand被认为是可以消除当前I/O架构性能瓶颈的一种新的I/O技术。该文首先分析当前I/O系统的瓶颈问题,然后从IBA整体架构、层次结构、通信机制与VI架构、链路特性与服务质量等方面介绍了InfiniBand的具体情况,最后将Infiniband与其它一些高性能互连网络和标准进行了比较。  相似文献   

4.
IBA与企业存储网络   总被引:1,自引:0,他引:1  
宋冬梅  常致全 《计算机应用》2002,22(1):56-56,59
介绍了网络存储的两种机制,展望了在一种新的I/O体系结构InfiniBand上实现网络存储的前景。  相似文献   

5.
Lonworks技术中的核心是神经元芯片,本文祥述了神经元芯片的一种I/O应用模式——并行口I/O模式,并介绍了基于此I/O模式设计开发的Lonworks协议与RS——232标准转换的互连适配器。  相似文献   

6.
随着Internet数据中心的快速发展 ,基于传统PCI总线的网络服务器越来越难以胜任数据密集型应用的要求。采用InfiniBand体系结构 (IBA)的高性能网络服务器可以充分发挥InfiniBand结构的优势 ,改善系统的I/O吞吐能力。首先介绍了当前总线技术面临的巨大问题 ,随后对InfiniBand体系结构的基本概念进行了介绍 ,对其主要特点做了深入分析 ,并将InfiniBand技术与其它互连技术做了比较 ;最后 ,提出了一个利用现有InfiniBand产品构建高性能网络服务器的结构。  相似文献   

7.
I/O互联技术及体系结构的研究与发展   总被引:4,自引:0,他引:4  
I/O互联技术及体系结陶正在发生重大变革,相继涌现了一系列新兴高性能I/O互联技术,包括PCIExpress、RapidIO、HyperTransport以及InfiniBand。该文对它们分别予以研究介绍,针对各自的体系结构、技术特性和应用领域,分别提出了一种合理的系统结构方案。并对这几种I/O互联技术的主要技术特性进行了简要而全面的比较,分析了I/O互联技术及体系结构的现状与发展趋势。  相似文献   

8.
并行文件系统的框架设计和性能研究   总被引:1,自引:0,他引:1       下载免费PDF全文
利用InfiniBand技术特征实现高效的并行文件系统(EPFS),设计一个高性能的透明传输层,对数据流的缓存管理、动态和公平的缓存共享,以及有效的内存注册和注销进行研究。实验表明,当I/O节点足够多时,随着计算节点的增加,基于InfiniBand技术的EPFS比基于TCP/IP的EPFS的读写性能增长更快。并且,两级别的内存注册和注销方法AFMRD比受约束的缓存技术更好地改进I/O性能。  相似文献   

9.
基于InfiniBand网络存储的研究与设计   总被引:2,自引:0,他引:2  
本文介绍了传统的存储体系结构的缺陷以及网络存储的现状,并探讨一种新型I/O技术-InfiniBand,进而阐述基于InfiniBand的I/O体系结构的研究,以及IB模拟器的设计.  相似文献   

10.
本文在分析了PC系统微机系统16位总线结构的基础上,设计并实现了两种16位I/O接口电路。  相似文献   

11.
如何有效地解决I/O瓶颈问题,一直是高性能并行计算机有待研究解决的关键技术。我们提出了一种可伸缩分布共享并行I/O系统方案,并自行研制了结点控制器芯片和路由器芯片,研制了原型系统SDSP604。为实现系统的计算、通讯和I/O性能随着系统规模均衡扩展的目标,该系统基于CC-NUMA系统结构,采用了合理的分布共享并行I/O系统结构。  相似文献   

12.
为了缓解I/O瓶颈问题,可以从应用程序、可扩展算法、编译器和语言、运行时库、操作系统和体系结构六方面展开研究。其中,I/O体系结构是所有技术途径的关键支撑。当前并行I/O性能分析缺乏科学的理论模型为I/O体系结构设计提供理论依据。本文针对并行计算机系统的可扩展性问题,研究了I/O负载对并行计算机系统可扩展性的影响,建立了I/O受限的并行加速比性能模型,对目前大规模并行计算机系统中三种常用I/O体系结构的可扩展性进行了分析;以此为理论依据,提出了一种面向高性能计算的可扩展并行I/O系统结构。同时,还提出了几种有效降低I/O操作服务时间的策略,从而达到增强系统可扩展性的目的,为后续研究奠定了基础。  相似文献   

13.
分析了几种典型仿真I/O体系结构的优缺点,设计并实现了一种软硬件可伸缩的分布式 仿真二级I/O体系结构,该结构不仅直接支持了共享的时分多路通道存取型数字设备(如7段数码管 显示器),将硬联逻辑复杂度从O(n)降低到O(logn)的水平,而且具有实时性、可伸缩性、容错性、可 维护性和通用性等良好特征,较好地满足了半实物仿真系统的需要。  相似文献   

14.
System Architecture of Godson-3 Multi-Core Processors   总被引:1,自引:0,他引:1       下载免费PDF全文
Godson-3 is the latest generation of Godson microprocessor family.It takes a scalable multi-core architecture with hardware support for accelerating applications including X86 emulation and signal processing.This paper introduces the system architecture of Godson-3 from various aspects including system scalabihty,organization of memory hierarchy, network-on-chip,inter-chip connection and I/O subsystem.  相似文献   

15.
随着E级计算的屏障被打破,高性能计算已经迈入了新时代。为了满足日益增长的数据访问需求,新兴的技术和存储介质都被运用到了超级计算机中,这使得其架构变得日趋复杂,其性能异常和系统热点定位也变得十分困难。为此,设计并实现了一个面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统——Beacon+。该系统无需修改应用代码/脚本即可对每个应用的数据访问过程进行全路径实时监控与分析。通过在线+离线的压缩方法和分布式缓存/存储等机制,Beacon+在保证系统本身高扩展性、低开销的同时还可以持续稳定地提供I/O诊断服务。以神威新一代超级计算机为部署平台,通过I/O标准测试应用和实际应用证明了Beacon+的低开销和高准确性,以及I/O诊断的高效性。  相似文献   

16.
DeBenedictis  E.P. Johnson  S.C. 《Computer》1993,26(11):43-53
Because it retrieves all instructions and data from a single memory, the von Neumann computer architecture has a fundamental speed limit. The scalable multicomputer architecture, which uses many microprocessors together to solve a single problem and can run at teraflop speeds, may be a solution. While teraflop processor technology is known, the scalable operating and I/O system technology necessary for those speeds are not known. The authors describe how Unix can be extended to scalable computing, permitting teraflop speeds and offering parallel computing to users unfamiliar with parallel programming. They designed this technology into the system software of the Ncube-2, the predecessor to Ncube's announced teraflop parallel computer. The authors describe the system in detail and provide some performance results  相似文献   

17.
Portable image processing applications require an efficient, scalable platform with localized computing regions. This paper presents a new class of area I/O systolic architecture to exploit the physical data locality of planar data streams by processing data where it falls. A synthesis technique using dependence graphs, data partitioning, and computation mapping is developed to handle planar data streams and to systematically design arrays with area I/O. Simulation results show that the use of area I/O provides a 16 times speedup over systems with perimeter I/O. Performance comparisons for a set of signal processing algorithms show that systolic arrays that consider planar data streams in the design process are up to three times faster than traditional arrays  相似文献   

18.
可扩展并行处理机系统有两个需要解决的问题:(1)多级互连网络的延迟;(2)吞吐能力;本文根据SPP体系结构的特点和实际应用的需要提出了解决这两个瓶颈问题的有效方法在前端服务器与共享存储器之间设计专用的并行I/O处理机作为系统I/O设备与SM/SSM的直接数据通路。  相似文献   

19.
Server performance is one of the critical activities in the data grid environment. A large number of applications require access to huge volumes of data from grid servers. In this case, efficient, scalable and robust grid server which can deal with large file transfer concurrent is needed. In this paper, we analyze the bottleneck of our grid servers and introduce user-space I/O scheduling, zero copy and event-driven architecture in our grid server to improve the servers’ performance. The user-space I/O scheduling can save almost 50% I/O time in a huge number of small files transfer. Grid servers can elimination CPU consumptions between kernel and user space by zero copy and cut 63% times for context switches. Event-driven architecture will save 30% CPU usage to reach the best performance by thread-driven architecture. Optimization method combination of these three above are used in our grid servers, the full-load throughput of our system is 30% more than traditional solutions and only 60% CPU consumed compared with traditional solutions.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号