期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机工程与科学》2017,(10):1781-1787

随着对高性能计算机性能需求的不断提升,高性能计算机的系统规模在逐渐扩大,系统内的互连网络已经成为影响性能的关键因素。如何基于高阶路由器构建更大规模、更低网络延迟以及成本、更高网络吞吐率的互连网络,是目前的主要研究方向。针对目前广泛应用的高阶网络进行特性分析,并对其中的环网以及树网进行综合,提出了一种新型层次化混合互连网络拓扑结构。该结构具有良好的可扩展性以及通信能力,并在网络模拟器NetSim上对其性能进行了仿真和分析。相似文献

2.

高阶路由器结构研究综述

杨文祥董德尊雷斐李存禄吴际孙凯旋《计算机工程与科学》2016,38(8):1517-1523

随着高性能网络规模的增加,高阶路由器结构设计成为高性能计算中研究的重点和热点。使用高阶路由器,网络能实现更低的报文传输延迟、网络构建成本和网络功耗,同时高阶路由器的应用还可以提高网络可靠性。过去十年是高阶路由器发展最快的时期,对近年高阶路由器的研究进行了综述,并对未来发展趋势进行了预测,主要介绍了以YARC为代表的经典结构化设计以及"network within a network"等近年来涌现的新型设计方法。未来的研究重点是解决高阶路由器结构设计中遇到的缓存和仲裁等各种问题,并利用光互连等技术设计性能更好的结构。相似文献

3.

基于Clos网络的高阶路由器结构

施得君李宏亮胡舒凯《计算机工程与科学》2023,(12):2099-2112

路由器为高性能互连网络的关键组成部分，利用高阶路由器可灵活构建网络直径低、路由路径丰富、容错性能高的拓扑结构。分层结构将整个路由器分成多个子交叉开关实现，子交叉开关规模较小，典型实现为子交叉开关的数量等于路由器端口数，每个子交叉开关对应一个输入/输出端口。分层结构每个子交叉开关的输入和输出都设有缓冲区，导致分层结构路由器内部有大量缓冲区，扩展性受限。网络结构将用于构建系统的网络拓扑实现在片内，如通过网格、全互连或胖树连接较小的交换机，并通过集成电路技术实现在一个路由器中，对外表现为一个高阶路由器。网络结构成本低，构建系统网络后除了要考虑系统网络拓扑的性能，还需要考虑路由器本身的路由问题。提出基于Clos网络的分层结构路由器，综合了传统分层结构高性能和网络结构低成本的优点，并提出2种Clos网络的调度算法，在均匀流量模式下接近100%带宽，RTL综合评估其实现最多减少面积25.9%。相似文献

4.

一种新型混合互连网络拓扑结构的分析与优化

杨明英雷斐董德尊沈胜宇庞征斌《计算机工程与科学》2014,36(12):2400

随着高性能互连网络规模的增大,如何通过互连网络拓扑结构的设计来提升系统的性能和降低物理开销成为了系统设计的关键之一。传统的拓扑结构(可分为直接网络和间接网络)在网络规模增加时,不能很好地折衷网络性能和物理开销的关系。2012年Roberto P等人提出一种新型混合的拓扑结构,结合了直接网络和间接网络的特点,有效考虑了物理开销和网络性能的折衷。在此基础上,将新型混合拓扑每一维上的唯一的一个间接网络优化为多个间接网络,经过理论分析和实验模拟新型混合拓扑结构优化后的混合拓扑结构以及较常用的传统拓扑结构,优化后的混合拓扑结构能够在提升网络性能的同时降低物理开销。相似文献

5.

一种新型片上网络互连结构的仿真和实现 总被引：2，自引：0，他引：2

陈芳露陆雯青虞志益周晓方《小型微型计算机系统》2010,31(5)

综合性能、硬件实现等方面考虑,提出一种基于片上网络的互连拓扑结构-层次化路由结构MLR(Multi-Layer Router).该结构通过层次化设计减小网络直径,具有良好的对称性和扩展性.网络建模仿真和硬件实现结果显示,在不同网络负载和不同IP核节点数的情况下,MLR与传统结构相比,在处理网络通信时,对于网络丢包率、通信延迟和网络吞吐量等网络性能参数均有最多50%-70%的提升;同时通过共享路由的方式,减少了超过20%的芯片面积和40%以上的动态功耗,有效降低了互连结构的硬件开销相似文献

6.

一种多级无缓存高阶路由器的设计与实现

杨文祥董德尊李存禄雷斐孙凯旋吴际《计算机工程与科学》2017,39(2):245-251

随着高性能网络规模的增加,高阶路由器结构设计成为高性能计算研究的重点和热点。使用高阶路由器,网络能实现更低的报文传输延迟、网络功耗和网络构建成本,同时高阶路由器的应用还可以提高网络可靠性。高性能路由器的阶数不断提高,仅靠扩展单级crossbar交换结构的阶数使路由器内部的连线资源急速增长,交叉开关的实现代价将不可接受,这就需要为高阶路由器设计新型的交换结构。近十年来,出现了以YARC为代表的经典结构化设计以及"network within a network"等新型设计方法,未来的研究重点是解决高阶路由器结构设计中遇到的缓存、仲裁和扩展性等各种问题。鉴于此,实现了一种多级无缓存高阶路由器,这种高阶路由器内部是一个多级Clos网络,每一级有相应的仲裁模块对请求进行调度,数据包缓存在输入/输出端口实现,除去这些缓冲区单元,该网络是无缓存的。最后通过BookSim模拟器进行了大量的性能测试,所设计的路由器能够正常工作,性能良好。相似文献

7.

神威E级原型机互连网络和消息机制

高剑刚卢宏生何王全任秀江陈淑平斯添浩周舟胡舒凯于康魏迪《计算机学报》2021,44(1):222-234

本文描述了神威E级原型机的互连网络和消息机制.神威E级原型机是继神威蓝光、神威·太湖之光之后神威家族的第三代计算机.该计算机作为一台E级计算机的原型机,峰值性能3.13 PFlops,其最大的特色之一就是采用28 Gbps传输技术,设计开发了新一代的神威高阶路由器和神威高性能网络接口两款芯片,在传统胖树的基础上,设计了双轨泛树拓扑结构,定义实现了新颖的神威消息原语和消息库,实现了一种基于包级粒度动态切换的双轨乱序消息机制,通信性能比神威·太湖之光互连网络提升了4倍,为神威E级计算机互连网络的研制奠定了基础. 相似文献

8.

基于参数的层次化Mesh互连片上网络结构_*

简刚韩国栋马钊坤周玉瀚《计算机应用研究》2016,33(6)

提出一种基于参数的层次化Mesh互连片上网络结构—PHNoC,解决片上网络规模扩张引起的通信延迟和吞吐性能下降问题。采用分簇多层次互连的思想,提高片上网络扩展性和连通性;引入层数和分簇类型参数,实现不同网络规模的灵活配置;引入跨层流控参数,控制并平衡层间负载流量。仿真试验表明,在多种流量模式下,不同网络规模时,PHNoC结构的延迟和吞吐性能相比传统的平面或两层结构优势明显,而资源开销和实现复杂度增加不大,说明增加多层互连资源可有效换取通信性能的提高。相似文献

9.

高性能计算机互连系统研究

下载免费PDF全文

邓波《计算机工程与科学》2001,23(3):109

互连系统是构成高性能计算机系统和决定系统通信性能的关键部分 ,其主要功能是实现系统中大量结点机间的消息传送。因而其通信带宽和延迟将直接影响高性能计算机系统计算能力和效率的发挥。本文重点研究高性能计算机“高带宽、低延迟”互连系统技术 ,以支持高性能计算机系统计算能力和效率的更好发挥。本文研究了高性能计算机系统的性能度量和提升途径 ,分析并找出了影响系统加速比的关键因素。分析了互连系统中的拓扑结构、切换技术、流控策略和路由算法等方面采用的技术和研究现状 ,总结了提高互连通信系统性能的技术途径。本文对高性能计… 相似文献

10.

一种新的基于预约的拥塞避免机制

朱成阳柴燕涛董德尊张鹤颖庞征斌《计算机工程与科学》2016,38(2):240-248

由于高速互连网络上的负载不均衡,一些网络结点成为了热点,可能导致部分结点或是链路拥塞,这会极大地降低互连网络的性能。现有的基于预约的拥塞避免技术SRP可以进行主动的拥塞避免,极大地缓解了由于热点问题所带来的负面效应。但是,在热点模式下,其它非热点结点的路由器资源绝大多数处于空闲状态,为了进一步充分利用互连网络的资源,提升互连网络性能,提出了一种基于SRP改进的中间结点缓存技术IRP。IRP可以根据不同的拓扑,例如胖树,有效地利用热点的邻居结点的路由器资源,先利用胖树拓扑的多路径将报文发送给空闲路由器,一旦目的结点路由器可利用,则将缓存报文发送给目的结点,降低互连网络的延迟。相似文献

11.

一种基于分层Mesh网络的层次化NoC拓扑结构

《计算机工程》2017,(10):1-5

针对片上网络中距离较远节点之间通信延迟过大的问题,提出一种层次化HDMesh拓扑结构。该拓扑结构采用分层设计,底层网络使用Mesh结构互连进行临近节点通信,顶层网络在Mesh结构的基础上增加2条对角链路以降低通信延迟。为避免顶层网络的拥塞,设计相应的HDXY路由算法,对各层流量进行合理分配。实验结果表明,在Rent流量模式下,相比Mesh,CMesh和CHMesh拓扑结构,HDMesh拓扑结构具有更低的通信延迟和更高的网络吞吐量。相似文献

12.

一种运算簇间互连通信单元的设计

李斌谢憬毛志刚《计算机工程》2013,(9)

在高性能并行处理器设计中,权衡通信效率与硬件设计开销是一个关键的问题。基于此,在基于簇状处理单元的线性阵列处理器架构前提下,提出一种基于多运算簇处理器结构的运算簇间互连通信设计方案,包括通信单元结构和典型数字信号处理数据传输的应用案例分析。实验结果表明,与传统线性阵列处理器结构相比,该方案可使互连通信单元的相应性能提升30%以上。相似文献

13.

多机互连网络与并行算法结构关系的分析及其在Transputer网上的仿真研究

林成江《小型微型计算机系统》1993,(2)

本文通过对多机互连网络建模,着重分析了并行算法结构对各种拓扑互连结构性能的影响,以及多机系统中用于结点间交换信息的通信开销,并对该模型在Transputer网上用TRANSIM进行了仿真研究。相似文献

14.

片上互连网络的功耗特征分析与优化

孙晓乐钱亚龙齐新新张云放陈娟袁远董勇《计算机工程与科学》2020,42(7):1141-1150

随着处理器核数的增加,片上互连网络NoC结构日趋复杂,导致片上互连网络功耗所占的比重和功耗分析的难度也在增加。片上互连网络的任务映射,既要保证多处理器核心之间通信的高性能,又要保证耗费尽可能少的功耗和面积,即在有限的功耗和面积开销下获得较高的性能。在进行任务映射时,核心之间的通信距离是减少任务通信功耗的关键。连续且近凸的区域有助于缩短任务的通信距离。分析了一种功耗最优的片上互连网络启发式映射算法（INC）,该算法由区域选择算法和节点映射算法组成。对区域选择算法的2个因子进行了改进,使应用总的通信开销最小化且保证后续应用以很小的通信代价进行区域选择。提出了新的基于选择区域的映射算法。它们在动态到达程序映射问题中的实验结果表明,新的区域选择算法和节点映射算法相比于INC,可以减少12.10%的通信功耗,并且带来11.23%的通信延迟优化。相似文献

15.

一种面向高性能计算的多FPGA互连结构及划分方法

肖春华黄樟钦李达《计算机应用研究》2015,32(1):150-155

针对高性能计算系统在大规模通信互连中面临的性能、成本及功耗等问题,融合新兴的高速互连技术,结合大规模、超大规模系统通信的局部性和异构性,提出基于多FPGA的混合层级高速互连结构,并给出基于集群的多FPGA逻辑功能划分方法。该方法能够根据不同应用自定义设计高效互连网络,降低大规模计算系统的互连成本和开销。通过应用实例实验证明,该方法能够实现大规模设计向多FPGA高性能计算平台的快速映射,加速高性能可配置计算系统的设计实现。相似文献

16.

一种低开销的面向节点内互连的网络接口控制器

苏勇曹政刘飞龙王展刘小丽安学军孙凝晖《计算机学报》2015,38(5)

高性能计算和云计算的飞速发展对高性能互连网络的设计提出了越来越高的要求:除了要保证高带宽、低延迟和高可靠性等特性,还要面临成本和系统规模的挑战.该文针对这些特性和挑战提出了一种低开销的基于cHPP体系结构的超节点网络接口控制器:(1)设计了兼容PCIe的网络通信协议,降低协议转换开销、减少通信延迟并增强系统可扩展性能;(2)采用PCIe高速通信接口并支持用户级通信提高软硬件交互效率,面向MPI编程模型抽象出高效通信原语(如NAP、PUT和GET)加速大数据传输;(3)硬件支持I/O虚拟化实现超节点内对网络接口控制器的高效共享.为了对该文的设计进行功能和性能验证,文章基于FPGA实现了系统原型,实验结果显示最低延迟为1.242μs,有效数据带宽可达3.19 GB/s. 相似文献

17.

硬件归约的延迟模型和调度策略

孙全宝张民选肖立权《计算机工程与设计》2009,30(8)

通过硬件对归约进行支持是高性能互连网络发展的一种趋势.建立了无冲突和冲突条件下的归约延迟模型,分析了串行轮询、剩余报文集中和先到先服务3种调度策略对归约延迟的影响,表明了剩余报文集中策略能够取得多个归约操作在路由器上平均延迟的最小值.为了准确评测各种调度策略的性能,基于OMNeT++开发了微片级互连网络模拟器.模拟结果表明,先到先服务策略能够取得最优的性能,而在低维度互连网络中,串行轮询策略能取得良好的性价比. 相似文献

18.

新型互连网络NIN研究 总被引：4，自引：0，他引：4

周知予夏培肃唐志敏《计算机学报》2000,23(8):785-792

以通信延迟和网络吞吐率这两个重要参数为出发点,以大规模并行处理系统的新型互连网络（ＮＩＮ）进行了理论分析和模拟测试,并与二维网格、环形网以及反图拓扑互连网络进行了比较,结果表明：与其它三种网络相比,ＮＩＮ不仅保持了反图拓扑互连网络可以连接更多处理机的优点,同时还具有较短的通信延迟和较高的网络吞吐率。相似文献

19.

一种可配置双向链路的片上网络容错偏转路由器

冯超超张民选李晋文戴艺《计算机研究与发展》2014,(2)

随着CMOS工艺进入纳米时代,工艺尺寸的不断缩小增加了集成电路对瞬态故障与永久故障的敏感性.在片上网络中提供容错支持对于提高单芯片多处理器片上数据传输的可靠性至关重要.为了处理片上网络中的瞬态故障与永久故障链路,提出一种可配置双向链路的容错偏转路由器BiFTDR.相邻BiFTDR路由器之间采用一对可配置方向的双向链路互连,根据链路的故障状态和路由器的到达包信息对双向链路的方向进行动态配置,在单向链路故障的情况下不需要绕道路由即可实现容错,并且不需要路由表从而降低了路由器的硬件实现开销.模拟结果表明,在合成通信模式下,网络中包含5条和15条永久故障链路的情况下,BiFTDR路由器的包平均延迟比一种基于强化学习的容错偏转路由器分别少10%和19%;在真实应用运行踪迹通信模式下,与无故障网络的包平均延迟相比,BiFTDR路由器的性能损失不到1%.对于瞬态故障,即使在高故障率下BiFTDR路由器的性能下降程度也较小.在65nm工艺下对BiFTDR路由器进行综合,能达到500MHz的时钟频率,并且具有较小的面积和功耗开销. 相似文献

20.

一种二维片上网络路由器的设计实现

下载免费PDF全文

蔡升《计算机测量与控制》2019,27(9):209-212

片上网络(Network on Chip, NoC)作为解决众核芯片互连的主流方案,其性能很大程度上取决于网络的拓扑结构。而网络拓扑结构的效能受到网络路由器的直接影响。因此,基于特定拓扑结构的路由器设计实现具有非常重要的研究意义。因此将XY路由算法应用于路由器节点中,设计了基于2D Mesh拓扑结构、轮询仲裁机制与虫孔交换流控的片上网络路由器,并使用Modelsim对路由器进行了功能验证。实验结果表明,设计的路由器能满足微片数据的处理,能够正确的收发数据包。相似文献