共查询到19条相似文献,搜索用时 62 毫秒
1.
精确的网络流量分类是实现互联网可控可管的关键,传统的单一分类算法需要构建基于特定假设的某种模型,算法对于待分类数据的分布要求高,不能满足复杂多变的网络流量的分类要求。基于此,采用多决策树组合的随机森林算法实现网络流量分类。通过实际网络流量数据实验表明,在各种情况下,随机森林算法都能显著改善网络流量特别是小比例样本的分类效果,算法降低了单一算法过于依赖特定假设模型的要求,对于待分类样本的分布要求低,随机森林算法具有良好的分类效果和鲁棒性。 相似文献
2.
3.
基于集成学习提出了一种新的模糊分类规则的产生算法。将分类规则的前件、后件模糊化,在自适应提升(Adaptive Boosting,AdaBoost)算法的迭代中,调整训练实例的分布,利用遗传算法产生模糊分类规则。并在规则学习的适应度函数中引入训练实例的分布,使得模糊分类规则在产生阶段就考虑相互之间的协作,产生具有互补性的分类规则集。从而改善了模糊分类规则的整体识别能力,提高了分类识别精度。 相似文献
4.
5.
如今,对网络流量中各种应用进行准确分类和识别已经变得越来越重要,针对目前流量分析研究的不足,本文综合国内外相关研究成果,提出了在双向动态网络流模型的基础上,采用细粒度的Packet-Level序列特征属性对流量进行分析,建立序列特征属性与网络流类型之间的关联关系,实现了一种高效的、与端口无关的网络流分类方法. 相似文献
6.
7.
大规模的netflow训练数据集是构建高质量、高稳定网络流量分类器的必然要求。但随着网络流特征维数的提高和数据集规模的扩大,无论是网络流的分析处理还是基于支持向量机(SVM)的分类器模型的训练,都无法在有效的时间内得到有效的处理结果。本文基于Hadoop云计算平台,采用MapReduce技术对SVM网络流量分类器进行分布式学习和训练,构建CloudSVM网络流量分类器。通过对来自校园网出口镜像的近2 T的大规模网络流量的跟踪文件的分布式存储和处理,对抽取的样本数据集进行分类,实验验证了基于Hadoop平台分布式存储和并行处理大规模网络数据集的高效率性,也验证了CloudSVM分类器在不降低分类准确度的情况下可以快速收敛到最佳,并随着大规模网络流样本的增加,SVM分类器训练的时间趋近平稳。 相似文献
8.
9.
将半监督学习应用到应用流分类问题中,提出了一种基于半监督聚类的应用流分类算法(PSOSC).首先采用粒子群优化的K均值聚类方法对大量的无标记数据和少量的标记数据进行聚类,利用少量标记数据确定簇与应用类型的映射关系,实现应用流分类.实验表明PSOSC算法有较高的流准确率,同时,降低了对标记数据的需求. 相似文献
10.
短文本分类是网络内容安全的一种主要方法.然而,短文本固有的关键词特征稀疏和样本高度不均衡等特点,使得难以直接使用现有针对长文本的分类算法.本文提出了一种针对短文本的动态组合分类算法.首先构造出一种树状组合分类器结构,可有效缓解短文本特征稀疏和样本高度不均衡对分类性能的影响;进一步,提出了一种动态调整策略来训练组合分类器,可以根据样本的分布特点自适应地调整分类器的组合结构.测试实验表明,相对于传统的单一分类方法和集成分类方法,动态组合分类算法在短文本分类中可以获得更好的准确率和召回率. 相似文献
11.
Network traffic classification method basing on CNN 总被引:1,自引:0,他引:1
Since the feature selection process will directly affect the accuracy of the traffic classification based on the traditional machine learning method,a traffic classification algorithm based on convolution neural network was tailored.First,the min-max normalization method was utilized to process the traffic data and map them into gray images,which would be used as the input data of convolution neural network to realize the independent feature learning.Then,an improved structure of the classical convolution neural network was proposed,and the parameters of the feature map and the full connection layer were designed to select the optimal classification model to realize the traffic classification.The tailored method can improve the classification accuracy without the complex operation of the network traffic.A series of simulation test results with the public data sets and real data sets show that compared with the traditional classification methods,the tailored convolution neural network traffic classification method can improve the accuracy and reduce the time of classification. 相似文献
12.
基于连接图的互联网流量分类方法能反映主机间的通信行为,具有较高的分类稳定性,但是经验式总结的启发式规则有限,难以获得高分类准确率.研究分析了主机间通信行为模式和BOF方法,从具有相同{目的IP地址,目的端口号,传输层协议}网络流量中,提取主机间连接相关的行为统计特征(HCBF),采用C4.5决策树算法学习基于行为特征的分类规则,其无需人工建立启发式规则.在传统互联网和移动互联网流量数据集上,从基本分类性能和分类稳定性方面,与现有的特征集进行比较分析,实验结果表明,HCBF特征集合的类间区分能力和稳定性较高. 相似文献
13.
14.
针对目前应用流量分类算法效率不高的现状,提出一种以NetFlow统计的IP流记录信息作为输入的高速应用流量分类(FATC,fast application-level traffic classification)算法。该算法采用基于简单相关系数的测度选择算法衡量测度变量间的相关关系,删除对分类无用或相互冗余的测度,而后使用基于Bayes判别法的分类算法将网络流量分至误判损失最小的应用类别中。理论分析及实验表明,FATC算法在具有超过95%的分类准确率基础上,极大降低了当前应用流量分类方法在训练和分类过程的时空复杂度,满足实时准确分类当前10Gbit/s主干信道网络流量的需求。 相似文献
15.
16.
有效的PolSAR影像分类技术是PolSAR成功应用的基础,然而相比于比较成熟的PolSAR成像技术与系统设计,PolSAR影像分类技术的发展相对滞后,针对PolSAR影像面向对象分类研究中存在的问题,提出了一种新的结合多种目标极化分解、ReliefF-PSO_SVM和集成学习的PolSAR影像面向对象分类方法。该方法首先采用多种方法对PolSAR影像进行目标极化分解;然后将利用不同极化分解方法提取的极化参数组合成一幅多通道影像;接下来对多通道影像进行分割、特征提取;采用ReliefF-PSO_SVM算法进行特征选择,并保留适应度最高的N个特征子集进行分类,每一个特征子集对应一个分类结果;最后利用集成学习技术对各分类结果进行集成。以吉林省长春市部分区域为研究区,Radarsat2影像为数据源,将提出的方法应用于土地利用分类中,取得了较好的分类效果,总体精度和Kappa系数分别达到了85.06%和0.8006。此外,还构建了3种对比方法用于分类,对比结果进一步证明了所提方法在PolSAR影像分类中的优越性。 相似文献
17.
随着互联网技术的不断发展以及网络规模的不断扩大,应用的类别纷繁复杂,新型应用层出不穷。为了保障用户服务质量(QoS)并确保网络安全,准确快速的流量分类是运营商及网络管理者亟须解决的问题。首先给出网络流量分类的问题定义和性能指标;然后分别介绍基于机器学习和基于深度学习的流量分类方法,分析了这些方法的优缺点,并对现存问题进行阐述;接着围绕流量分类线上部署时会遇到的3个问题:数据集问题、新应用识别问题、部署开销问题对相关工作进行阐述与分析,并进一步探讨目前网络流量分类研究面临的挑战;最后对网络流量分类下一步的研究方向进行展望。 相似文献
18.
19.
利用FY-2C的红外和可见光自旋扫描辐射器(VISSR)多通道云图数据对云进行分类,提出了一种利用云图红外、可见光谱段数据,基于SOM神经网络的云分类算法。设计并编写了实际云图客观云分类程序,该程序输入为9个从VISSR各通道数据中提取出的特征,将数据分为8种不同的类型,并输出分类后的图像。 相似文献