期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机科学与探索》2016,(12):1693-1700

软件路由器在现代网络的发展中发挥着越来越重要的作用,而Click是具有良好模块化设计的软件路由器,为开发和验证新的路由协议等应用提供了很好的软件平台。由于实现机制问题,用户态Click的I/O性能严重限制报文处理能力,影响以Click软件路由器为平台的系统的整体性能。针对现有Click用户态I/O机制的不足,提出了一种面向用户态Click的I/O优化框架,通过采用轮询技术、零拷贝技术和报文预取技术提升了I/O性能。实验结果表明:优化后的用户态Click的I/O性能提升了121倍。相似文献

2.

基于多核的多线程程序优化研究

施惠丰袁道华《计算机技术与发展》2010,20(6):70-73

随着主流芯片厂商的大力推广,多核处理器已经变得越来越普及.以往串行化的程序设计方法在多核环境下已经不能充分利用多核CPU的资源.怎样高效地利用多核处理器的计算性能,已经成为软件开发者面临的新的课题.文中在传统的多线程编程基础上,根据Intel处理器的微架构(Microarchitecture)特点,以及Linux内核提供的CPU绑定技术,通过采用Cache优化和CPU亲和力(CPU affinity)优化,消除了多核环境下局部多线程Cache行竞争和伪共享,减少了线程的调度开销,提高了多线程程序的运行效率. 相似文献

3.

基于网络处理器的路由交换方案

解超杰武波《计算机技术与发展》2005,15(6)

网络处理器是新一代网络设备的核心器件,基于网络处理器的路由器交换机开发是一个热点.由于ASIC和通用CPU各自的局限无法满足日益增长的网络流量和业务的需求,从而出现了网络处理器,网络处理器一般是由通用处理器作为控制CPU,多个转发引擎并行处理分组以隐藏访问I/O设备的延时,并通过协处理器来加速路由查找、CRC计算等功能.通过分析网络处理器的体系结构并依据当前网络处理器发展的实际情况提出了几种基于网络处理器设计的路由交换系统方案,并分析了各种方案的特点及应用场合. 相似文献

4.

基于多核处理器的无锁零拷贝数据包转发框架

肖月振华蓓《计算机工程》2013,(12):35-39,53

为突破高速软件路由器转发路径中存储访问方面的性能瓶颈,分析PacketShader和Netmap2个软件路由器的转发结构和存在的问题,设计一个基于多核处理器的零拷贝包转发框架MapRouter。采用零拷贝技术去除包转发路径中的包拷贝,并借助并发无锁队列设计一个适合多端口间数据包零拷贝转发的包缓冲区管理方案。将高度优化的包I／O驱动、包缓冲区回收机制、无锁队列实现等一系列优化措施相结合,以提高转发速度。实验结果表明,对于不包括IP路由表查找的最小转发,MapRouter在模拟的两端VI路由器上可以达到i0Gb／s的转发速度,与PacketShader和Netmap相比,其转发速度更高、CPU利用率更低。相似文献

5.

基于端系统应用的分组I/O加速技术

《微型机与应用》2016,(7):63-66

在网络系统中,优化端系统的数据路径能够使数据在网络接口和应用程序之间快速移动。因此,研究基于端系统应用的分组I/O加速技术,对分组I/O的发送和接收路径分别优化,有助于提高数据移动效率,减少CPU停滞,实现内存并行处理。本文提出分组I/O接收端流亲和技术,分组I/O发送端链式发送技术。基于通用多核处理器和FPGA搭建端系统实验环境,并对分组I/O加速后的端系统进行性能测试,实验结果表明,采用分组I/O加速技术的端系统,能够使报文收发性能提升2.14倍。相似文献

6.

基于网络处理器的路由交换方案 总被引：4，自引：0，他引：4

解超杰武波《微机发展》2005,15(6):60-61,64

网络处理器是新一代网络设备的核心器件，基于网络处理器的路由器交换机开发是一个热点。由于ASIC和通用CPU各自的局限无法满足日益增长的网络流量和业务的需求，从而出现了网络处理器，网络处理器一般是由通用处理器作为控制CPU，多个转发引擎并行处理分组以隐藏访问I／O设备的延时，并通过协处理器来加速路由查找、CRC计算等功能。通过分析网络处理器的体系结构并依据当前网络处理器发展的实际情况提出了几种基于网络处理器设计的路由交换系统方案，并分析了各种方案的特点及应用场合。相似文献

7.

基于网络处理器的高速转发模块设计

贾玉君孟芳《计算机与网络》2009,(13):47-50

随着网络应用业务的不断增长,传统网络业务处理方案已不能满足新一代智能化网络设备设计要求。网络处理器具有强大协议处理能力和灵活可编程性特点,是下一代网络的核心技术之一。在分析研究了NP-2网络处理器的功能特点之后,介绍了一种基于网络处理器的高速转发模块设计方案,包括硬件设计、数据包转发流程,并给出了有关的转发性能测试数据。经测试验证,这种设计方案具有很高的报文处理和转发效率。相似文献

8.

面向新一代众核处理器的高性能SNC的设计与验证

徐海文张洋《计算机与数字工程》2021,49(8):1707-1713

先进可扩展接口(AXI)是ARM公司推出的应用于高频系统的通道型总线,广泛应用于各种高性能SoC设计中.当前,通用处理器的主流是多核处理器,而多核处理器的主流是"通用DSP内核+应用专用核心"的异构融合结构.应用专用核心分为两种结构:同构多核和异构多核.在同构多核结构中,随着核数的增加,逐渐采用超节点结构,即在处理器中,几个内核构成一个超级节点,通过超级节点控制器实现片上网络与DSP内核之间的数据交互.在这项工作中,论文基于AXI总线,为新一代多核处理器设计了一种高性能、高带宽、低延迟的超级节点控制器.该超级节点控制器设计具有单独的读写数据通道,使用双向VALID和READY信号来实现握手机制,支持不对齐的数据传输、burst数据传输、广播操作、并支持乱序交易等.验证和综合结果表明,该超级节点控制器可以正确实现DSP内核与片上网络之间的数据交互,性能满足设计要求. 相似文献

9.

基于TBB任务调度器的N皇后多核并行算法

郑晓薇张建强《计算机工程与设计》2010,31(15)

为了充分利用多核处理器资源,研究了Intel线程构建模块并行编程模式.基于任务调度器,建立了逻辑线程和物理线程最佳匹配和映射的面向任务编程模式.利用任务调度器,设计了N皇后问题在多核处理器的并行算法.该算法将任务自动地映射到多线程,减少消息传递和数据移动带来的额外开销,提高多核CPU的使用效率.并行算法的加速比接近核数,CPU使用效率超过90%,实验结果表明,该算法有效地提升了多核计算机资源的利用率. 相似文献

10.

一种适应多核处理器核间通信机制的设计

李静梅王军锋张岐《电脑学习》2011,1(4)

随着单芯片上集成处理器内核数量的增加,在支持多核处理器的应用程序方面,核间通信变得更加重要.通过分析多核运行任务特点,根据处理核上运行任务功能的不同,将处理核分成两类:控制核和计算核.根据对核的分类,提出了一种新的核间通信模型,该模型提供了三种不同的通信通道.运用这三条通道,把应用程序的I/O部分从计算核迁移到控制核来提高多核的利用率,实验结果表明该方式有效提高核间协作以及核间通信的效率,提升处理器的利用率. 相似文献

11.

Linux下内核空间以太网包的捕获设计

刘昊昱张亚生《计算机与网络》2009,(23):43-45

在Linux下通常的网络数据包捕获通过Libpcab函数框架实现,该体系下实现的包捕获存在着一些缺陷。探讨了netfilter框架在Linux内核中的实现,并利用netfilter框架进行以太网数据包的捕捉接收,经处理后实现数据包的重组发送。在内核空间处理网络数据包不仅提高了效率,减少了数据从内核空间传递到用户空间消耗的资源,而且可以截获网络上所有的以太网报文,对网络数据进行过滤和处理相似文献

12.

Accelerating network applications by distributed interfaces on heterogeneous multiprocessor architectures

Pablo Cascón Andrés Ortiz Julio Ortega Antonio F. Díaz Ignacio Rojas 《The Journal of supercomputing》2011,58(3):302-313

Hosts with several, possibly heterogeneous and/or multicore, processors provide new challenges and opportunities to accelerate applications with high communications bandwidth requirements. Many opportunities to scale these network applications with the increase in the link bandwidths are related to the exploitation of the available parallelism provided by the presence of several processing cores in the servers, not only for computing the workload of the user application but also for decreasing the overhead associated to the network interface and the system software. 相似文献

13.

底层通信协议中内存映射机制的设计与实现^* 总被引：4，自引：1，他引：3

刘炜郑纬民申俊鞠大鹏《软件学报》1999,10(1):24-28

在底层网络通信协议中使用内存映射机制为用户层应用提供了虚拟网络界面,使用户层能够方便地访问快速通信设备;通过减少系统软件的协议处理开销,有效地减少了网络通信的延迟.讨论了通信协议中的内存映射机制的设计思想和实现过程,提出了通信区的概念,利用通信区有效地完成核心与用户之间的数据交换.同时给出一个实例,对其实现与性能进行了分析. 相似文献

14.

基于FreeBSD内核的虚拟服务器研究与实现

汪黎杨学军章文嵩《计算机工程与科学》2011,33(3):46

服务器集群是实现高性能网络服务的有效结构,而报文转发技术是发挥服务器集群性能的关键。高效的报文转发技术使得集群的调度负载很轻,具有很高的可扩展性。IP隧道技术/直接路由是两种新颖而且高效的报文转发技术。FreeBSD是理想的网络服务器操作系统,但目前基于FreeBSD的集群调度系统均采用网络地址转换技术,系统可扩展性有限。本文讨论了基于FreeBSD操作系统内核,采用IP隧道/直接路由报文转发技术的虚拟服务器(FVS)系统的设计动机及实现,重点探讨了系统的体系结构及实现关键技术。我们基于FreeBSD-5.3内核实现了FVS系统,性能测试结果表明,该系统的调度负载很轻,有很好的可扩展性。相似文献

15.

运用差分演化算法实现多维包匹配的研究

王则林吴志健《计算机科学与探索》2012,6(7):612-620

互联网的发展已经使网速的瓶颈由链路速度转移到核心网络设备的包处理速度上,而包处理的核心工作是包匹配。传统方法难以做到包匹配速度适应核心网络设备数据包线速转发。提出了一种新的包匹配算法,该算法对差分演化算法进行了改进,并结合了改进算法和传统的包匹配算法。在适应值处理上运用统计学方法,从而增加了分析问题的客观性。数值实验表明,新算法与传统算法相比,在速度、存储空间以及更新时间等性能上得到了有效改善,另外新算法的包匹配的时间性能与规则数目只有很弱的相关性,从而适合处理多维和大规模问题。新算法把演化算法运用于多域大规模规则库的网络数据包的转发,并且数据包还能做到线速转发。新算法具有普适性,适用于防火墙、差别服务路由器等网络设备。相似文献

16.

高效报文捕获引擎FPC的研究与实现

下载免费PDF全文

唐勇胡华平罗宇《计算机工程与科学》2006,28(5):27-29

网络监测在现代基于IP的网络中具有越来越重要的作用.随着网络速度的增加,作为网络监测关键部分的报文捕获引擎暴露出了在性能上的不足.FPC是一个Linux下基于内核的高效报文捕获引擎,使用它可以有效提高网络监测等应用的性能.本文首先在硬件层次和软件层次上分析了报文捕获过程中可能的性能瓶颈,然后介绍了FPC的整体结构和实现的关键技术.测试和应用表明,FPC具有良好的性能. 相似文献

17.

基于链路可靠性的两跳QoS路由

孙子文吴平《信息与控制》2019,48(5):603

针对工业无线传感器网络对路由协议的QoS要求，研究了一种基于链路可靠性的两跳QoS路由（Link-Reliability Based Two-Hop Routing for QoS Guarantee in Industrial Wireless Sensor Networks， LRTHQR）.采用两跳速度策略和数据优先级调度策略提高实时性，采用改进的信任评估模型以选择可信路径进行路由，采用基于接收功率的链接概率和数据包重传次数作为衡量链路可靠性的指标，同时采用能够综合考虑节点剩余能量和转发能耗的转发策略，以改善网络寿命.仿真结果显示：与未考虑链路可靠性的NCSRT （NodeCredible Security Routing for IWSN Based on THTR）算法相比， LRTHQR算法在丢包率、时延以及包平均能耗方面有着明显优势；与同样侧重QoS要求的LRTHR （Link-Reliability based Two-Hop Routing）算法相比， LRTHQR算法在截止期错失率、路由开销以及包平均能耗方面有着显著提升. 相似文献

18.

High performance network virtualization with SR-IOV

Yaozu Dong Xiaowei Yang Jianhui Li Guangdeng Liao Kun Tian Haibing Guan 《Journal of Parallel and Distributed Computing》2012

Virtualization poses new challenges to I/O performance. The single-root I/O virtualization (SR-IOV) standard allows an I/O device to be shared by multiple Virtual Machines (VMs), without losing performance. We propose a generic virtualization architecture for SR-IOV-capable devices, which can be implemented on multiple Virtual Machine Monitors (VMMs). With the support of our architecture, the SR-IOV-capable device driver is highly portable and agnostic of the underlying VMM. Because the Virtual Function (VF) driver with SR-IOV architecture sticks to hardware and poses a challenge to VM migration, we also propose a dynamic network interface switching (DNIS) scheme to address the migration challenge. Based on our first implementation of the network device driver, we deployed several optimizations to reduce virtualization overhead. Then, we conducted comprehensive experiments to evaluate SR-IOV performance. The results show that SR-IOV can achieve a line rate throughput (9.48 Gbps) and scale network up to 60 VMs, at the cost of only 1.76% additional CPU overhead per VM, without sacrificing throughput and migration. 相似文献

19.

一种Linux平台上基于包过滤的网络流量采集系统

聂朝恩高荣芳《计算机应用》2007,27(8):1858-1861

设计并实现了一种Linux平台上基于包过滤的网络流量采集系统PFC。PFC系统主要通过在内核空间实现数据包的过滤、合并，以及实现了用户空间和内核空间的内存共享，从而突破了传统上基于包过滤网络流量采集系统的性能瓶颈。相似文献

20.

Performance of IP-forwarding of Linux hosts with multiple network interfaces

K. Salah M. Hamawi 《Journal of Network and Computer Applications》2013,36(1):452-465

This paper evaluates and compares the performance of IP-packet forwarding of a Linux host equipped with multiple network interface cards (NICs), namely two receiving NICs and one transmitting NIC. We consider a Linux host with SMP (Symmetric Multiprocessing) or multicore multiprocessor (MCMP) architecture. We measure IP forwarding by subjecting an MCMP Linux host to different traffic load conditions of up to 1 Gbps. We used the IXIA hardware traffic generator to generate traffic with fixed- and variable-size packets. At the Linux host, generated packets are forwarded/routed from the two receiving NICs to the transmitting NIC. We consider two NIC affinity modes: (I) both receiving NICs are affinitized (or bound) to two cores of the same processor while the transmitting NIC is affinitized to a core on a separate processor, and (II) the transmitting NIC and one receiving NIC are affinitized to two cores of the same processor while the second receving NIC is affinitized to a core on a separate processor. For each affinity mode, we measure the performance for three packet reception mechanisms: NAPI (New API) with a default budget of 300, NAPI with a budget of 2, and Disable and Enable interrupt handling. The performance is measured and compared in terms of various key performance metrics which include throughput, packet loss, round-trip delay, interrupt rates, and CPU availability. 相似文献