首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
一种基于SIMD技术的快速并行代数重建算法   总被引:2,自引:0,他引:2       下载免费PDF全文
代数重建算法是解决非完全投影数据重建的有效方法,尤其在对于超出探测器尺寸范围的大型零件的无损检测中已成为最有力的关键技术,但以往算法计算量较大、耗时较长。为了快速地进行代数重建,提出了一种基于Intel处理器单指令多数据(single instruction multiple data,SIMD)技术[2]的快速并行算法,并在充分分析代数重建公式特点的基础上,设计了一套便于并行化运算的数据结构及计算流程,其在运算中可一次性加载多个打包数据,利用MMX(multimedia extension)、SSE(streaming SIMD extension)和SSE2指令完成SIMD方式计算。通过仿真实验证明,该算法在达到同样精度的前提下,不仅提高了重建速度(加速比4倍),解决了传统代数重建算法运算速度慢的瓶颈问题,并且能够较好地重建部分数据缺失的投影图像,该算法对于航空航天大型零部件的无损检测具有重要的理论意义及工程应用价值。  相似文献   

2.
针对SVM (support vector machine)算法应用到大规模网络流量分类中存在计算复杂度高、训练速度慢等问题,提出一种基于云计算平台进行并行网络流量分类的SVM方法,以提高对大数据集的分类训练速度.该方法是一种采用云计算平台构建多级SVM和映射规约(MapReduce)模型的方法.它将训练数据集划分为多个子训练数据集,通过对所有子训练数据集进行并行训练,得到支持向量集,进而训练出流量分类模型.实验结果表明,与传统的SVM方法相比,并行SVM网络流量分类方法在保持较高分类精度的前提下,有效地减少了训练时间,提高了大规模网络流量分类的速度.  相似文献   

3.
基于概要数据结构可溯源的异常检测方法   总被引:2,自引:0,他引:2  
罗娜  李爱平  吴泉源  陆华彪 《软件学报》2009,20(10):2899-2906
提出一种基于sketch概要数据结构的异常检测方法.该方法实时记录网络数据流信息到sketch数据结构,然后每隔一定周期进行异常检测.采用EWMA(exponentially weighted moving average)预测模型预测每一周期的预测值,计算观测值与预测值之间的差异sketch,然后基于差异sketch采用均值均方差模型建立网络流量变化参考.该方法能够检测DDoS、扫描等攻击行为,并能追溯异常的IP地址.通过模拟实验验证,该方法占用很少的计算和存储资源,能够检测骨干网络流量中的异常IP地址.  相似文献   

4.
当区域互联网受到攻击时,其流量会发生较为明显的变化,因此提出基于流量特征的区域互联网攻击源IP地址检测方法。采用NetFlow技术采集用户高速转发的IP数据流,得到网络流量数据。针对网络流量中突变数据,实施去除处理。通过最小冗余最大相关性,提取互联网的流量特征,以提高攻击源IP地址的检测精度。以流量特征的信息熵作为输入,结合极限学习机与k均值算法实现攻击流量检测并确定互联网攻击源IP地址。测试结果表明:在该方法的应用下,攻击源IP地址检测质量指数在0.9以上,由此说明该方法的检测准确性更高,检测质量更好。  相似文献   

5.
为了解决高速网络流量分类系统的性能瓶颈问题,提出了一种并行网络流量分类系统负载均衡算法。该算法由静态预分配和动态自适应调整两部分组成,采用基于Hash流表实现负载的静态预分配,根据处理节点的动态反馈对Hash流表进行重映射。通过实验和静态Hash算法以及SHI算法进行了对比,实验结果表明,该算法负载均衡度好、丢包率小、流重映射率低,能够满足并行网络流量分类系统负载均衡的要求。  相似文献   

6.
GPU通用计算平台上中心差分格式显式有限元并行计算   总被引:3,自引:0,他引:3  
显式有限元是解决平面非线性动态问题的有效方法.由于显式有限元算法的条件稳定性,对于大规模的有限元问题的求解需要很长的计算时间.图形处理器(GPU)作为一种高度并行化的通用计算处理器,可以很好解决大规模科学计算的速度问题.统一计算架构(CUDA)为实现GPU通用计算提供了高效、简便的方法.因此,建立了基于GPU通用计算平台的中心差分格式的显式有限元并行计算方法.该方法针对GPU计算的特点,对串行算法的流程进行了优化和调整,通过采用线程与单元或节点的一一映射策略,实现了迭代过程的完全并行化.通过数值算例表明,在保证计算精度一致的前提下,采用NVIDIA GTX 460显卡,该方法能够大幅度提高计算效率,是求解平面非线性动态问题的一种高效简便的数值计算方法.  相似文献   

7.
基于特征分布分析的网络流量监测系统   总被引:4,自引:2,他引:2  
多数现有网络流量监测系统只关注流量大小,没有分析流量内部信息。该文利用熵来衡量源IP地址、目的IP地址、目的端口等流量特征参数的分布变化,从特征分布的角度对网络流量进行分析。采用该方法实现一个流量监测系统,实验结果证明,该系统具有较高检测率和较低误报率。  相似文献   

8.
汪精华  刘峰  龙腾 《计算机工程》2011,37(1):246-248
针对SAR成像算法高速实时处理、宽幅海量存储的特点,设计并实现一种基于多PowerPC处理器的高性能并行信号处理模块.该处理模块利用多种高速串行总线构成不同层次的互联网络以适应不同类型的数据流传输,结合具有混合并行结构的底层处理节点以完成SAR成像算法在该处理模块上的映射.应用结果表明,基于该处理模块构建的信号处理系统...  相似文献   

9.
多核处理器中,各个处理器核之间可以并发地进行外部存储访问,提供不同于单处理器的存储级并行(memory level parallelism)能力.不规则应用中的循环,传统的并行方法难以识别其并行性,不能充分利用多核处理器存储级并行能力和并行计算能力.对基于软件开发多核处理器存储级并行进行了讨论,提出一种前瞻并行多线程算法LLSM(loop level speculative mssultithreading).LLSM对不规则应用中的循环进行并行化,在多核处理器上的测试数据表明:该算法能够有效地挖掘多核处理器的存储级并行能力和计算能力,同时指出多核环境下存储级并行计算公式需要考虑线程同步开销.  相似文献   

10.
Intel 新一代处理器 KNL 作为一种具有极强运算能力的多核处理器,拥有 16GB 高速片上内存(MCDRAM),物理核心数量高达 72 个,单 CPU 的双精度浮点峰值为 3TFlops,为高并行负载应用提供强大的性能支持。各种主流的并行软件也纷纷使用 KNL 众核、高速内存技术,由于 LAMMPS (large-scale atomic/molecular massively parallel simulator) 在材料科学和计算化学中的广泛应用,因此在 KNL 节点上优化 LAMMPS 成为相关领域近些年的研究热点。本文以郑州超算中心的 KNL 集群为平台,采用 MCDRAM 和第三方扩展包两种方法对 LAMMPS 进行优化。MCDRAM 可以加快 CPU 读取数据的速度,第三方扩展包从源码的角度对程序中的条件判断进行优化。试验结果表明,优化后的 LAMMPS 执行时间明显减少,加速比可达 49x,是 CPU 平台加速比的 5.5x。  相似文献   

11.
提出一种用于多核网络处理器平台的串行与并行相结合的混合结构,该结构由串行多核与并行多核相结合构成.针对视频点播系统中的实时视频数据流,通过这样的混合结构,可以有效的提高多核网络平台发送实时数据的平稳性和精确性.并且与通用的并行对称结构相比较,混合结构在扩展性上更具有优势,可以通过扩展薄弱环节的核数提高系统的服务能力.  相似文献   

12.
高速网络流量测量方法   总被引:2,自引:1,他引:1  
周爱平  程光  郭晓军 《软件学报》2014,25(1):135-153
高速网络流量测量是目前实施实时准确地监测、管理和控制网络的基础.基于网络流量测量的应用,将网络流量测量分为抽样方法和数据流方法.从不同的层次,将抽样方法分为分组抽样和流抽样,分别介绍了两类抽样方法;从测度角度介绍了数据流方法.详细介绍了高速网络流量测量的常用数据结构,以及抽样、数据流方法在高速网络流量测量中的应用,比较了各种方法的优劣.概述了高速网络流量测量技术的研究进展.最后,就现有的网络流量测量方法的不足,对网络流量测量的发展趋势和进一步的研究方向进行了讨论.  相似文献   

13.
Identifying frequent items in high-speed network is important for a variety of network applications ranging from traffic engineering to anomaly detection such as detection of denial of service attacks. To deal with high packet arrival rate, it is desirable that such systems are able to support very high update throughput. The advent of multi-core processors calls for efficient parallel designs which can effectively utilize the parallelism of the multi-cores. In this paper, we address the problem of parallelizing weighted frequency counting in the context of multi-core processors. We discuss the challenges in designing an efficient parallel system. Our evaluation and analysis reveals that the naive fine-grained lock design results in excessive overhead and wait, which in turn leads to severe performance degradation in multi-core architectures. Based on our analysis, we propose a novel method: precision integrated method (PRIM). PRIM makes use of the temporal imprecision concept to significantly reduce the merge overhead at the cost of relatively large memory space used. Both the theoretical analysis and real traffic experiments demonstrate that PRIM delivers almost linear speedup.  相似文献   

14.
In this study, a fuzzy autoregressive (fuzzy-AR) model is proposed to describe the traffic characteristics of high-speed networks. The fuzzy-AR model approximates a nonlinear time-variant process with a combination of several linear local AR processes using a fuzzy clustering method. We propose that the use of this fuzzy-AR model has greater potential for congestion control of packet network traffic. The parameter estimation problem in fuzzy-AR modeling is treated by a clustering algorithm developed from actual traffic data in high-speed networks. Based on the adaptive AR-prediction model and queueing theory, a simple congestion control scheme is proposed to provide an efficient traffic management for high-speed networks. Finally, using the actual Ethernet-LAN packet traffic data, several examples are given to demonstrate the validity of this proposed method for high-speed network traffic control  相似文献   

15.
在LEO卫星网络中,由于卫星高速运动导致的网络拓扑变化和不同卫星覆盖城内流量的非规整性给设计其特殊路由算法带来很大挑战。结合卫星网络的固有特点,本文提出一种基于路径信息压缩的分布式路由算法CPDR(Compressed Path Information based Distributed Routing)。该算法使用分布式分层链路状态收集策略和简洁的路径信息编码机制,能够在不引入额外信令开销基础之上提供多路径路由能力,实现卫星网路中的流量负载平衡、优化网络带宽应用、提高星际链路利用率。  相似文献   

16.
刘宇  李康  马佩军  史江义 《计算机工程》2010,36(14):215-217
提出一种用于多核网络处理器数据通道处理的高速MAC接口数据交换控制结构。利用主动请求机制控制数据包的接收,通过多线程分配策略实现对接收数据的并行处理,维护数据包的到达顺序,实现高速数据传输。仿真与验证结果表明,接收控制器模块能在85 MHz工作时钟下达到2.56 Gb/s的数据吞吐率,满足网络处理器OC-48的线速处理要求。  相似文献   

17.
脉冲神经网络属于第三代人工神经网络,它是更具有生物可解释性的神经网络模型。随着人们对脉冲神经网络不断深入地研究,不仅神经元空间结构更为复杂,而且神经网络结构规模也随之增大。以串行计算的方式,难以在个人计算机上实现脉冲神经网络的模拟仿真。为此,设计了一个多核并行的脉冲神经网络模拟器,对神经元进行编码与映射,自定义路由表解决了多核间的网络通信,以时间驱动为策略,实现核与核间的动态同步,在模拟器上进行脉冲神经网络的并行计算。以Izhikevich脉冲神经元为模型,在模拟环境下进行仿真实验,结果表明多核并行计算相比传统的串行计算在效率方面约有两倍的提升,可为类似的脉冲神经网络的模拟并行化设计提供参考。  相似文献   

18.
一种业务流自适应尽力采样方法   总被引:2,自引:1,他引:2  
基于业务流的网络流量监测是网络管理、运维、实现基于业务的计费、流量工程等的重要手段.精确、高效的采样技术是实现高速网络流量业务流监测分析的重要技术.基于分段采样思想提出一种尽力最优的自适应随机采样方法,实现特大业务流的精确估计,其中把监测系统本身的处理能力作为选择采样概率的参数.实验结果显示算法能够很好地调节采样概率,使得采样包速率基本等于预先设定的监测系统的处理能力.  相似文献   

19.
With the expansion of computer networks, there is a strong need for monitoring their properties in order to diagnose any problems and manage them in the best possible way. This monitoring is particularly useful if performed in real-time, however, such an approach is rather difficult (if not impossible) to implement in networks with increased traffic, using a passive monitoring scheme. One way to overcome this problem is to selectively sample network data, which in turn opens new issues such as how frequently this sampling should be performed, so as to obtain useful and exploitable data. In this work it is shown that it is possible to accurately represent high-speed network traffic using suitable time series models and then determine the size of the sampling window, so as to detect packet loss. The resulting scheme is scalable, protocol-independent and able to raise alerts in real time.  相似文献   

20.
目前,Internet已经进入高速率骨干网和高速率接入网的阶段,因此需要实时地监控网络流量并检测出有攻击意向的异常,及时采取适当的行动来遏制它进一步的繁殖和传播。本文主要分析了现有网络异常分析的四种方法,并进行对比;提出了基于Netflow的异常流量分离设计思想,对于今后网络流量异常检测分析具有一定作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号