首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 156 毫秒

1.  基于决策树的流量分类方法*  被引次数:4
   徐鹏  林森  刘琼《计算机应用研究》,2008年第25卷第8期
   近年来,利用机器学习方法处理流量分类问题已成为网络测量领域一个新兴的研究方向。在目前研究中应用较多的是朴素贝叶斯方法及其改进算法,但这些基于贝叶斯定理的分类方法过于依赖样本空间的分布,具有潜在的不稳定性。为此,引入C4.5决策树方法来处理流量分类问题。C4.5决策树方法利用信息熵来构建分类模型,无须假设先验概率的稳定。实验结果表明C4.5决策树方法可以有效避免网络流分布变化所带来的影响。    

2.  基于决策树的P2P流量识别方法研究  
   李晟锴《计算机技术与发展》,2011年第21卷第12期
   针对新型P2P业务采用净荷加密和伪装端口等方法来逃避检测的问题,提出了一种基于决策树的P2P流量识别方法.该方法将决策树方法应用于网络流量识别领域,以适应网络流量的识别要求.决策树方法通过利用训练数据集中的信息熵来构建分类模型,并通过对分类模型的简单查找来完成未知网络流样本的分类.实验结果验证了C4.5决策树算法相比较Na(i)ve Bayes、Bayes Network算法,处理相对简单且计算量不大,具有较高的数据处理效率和分类精度,能够提高网络流量分类精度,更适用于P2P流量识别.    

3.  基于决策树的网络流量异常分析与检测  
   李强  严承华  朱瑶《计算机工程》,2012年第38卷第5期
   针对现有网络流量异常检测方法准确率较低的问题,提出基于决策树的网络流量异常分析与检测方法。研究网络流量结构特征及流量异常的交叉熵表示方法。采用C4.5算法建立决策树模型,将具有连续性的属性值离散化,根据最大信息增益比逐层选取分类属性,依此规则对流量数据进行分类。实验结果表明,当该方法的检测准确率达90%以上时,误报率可控制在5%以内,与同类方法相比能更准确地发现网络流量异常并进行分类。    

4.  基于决策树模型的P2P流量分类方法  
   陈云菁  张赟  陈经涛《计算机应用研究》,2009年第26卷第12期
   P2P流量逐渐成为互联网流量的重要组成部分,精确分类P2P流量对于有效管理网络和合理利用网络资源都具有重要意义。近年来,利用机器学习方法处理P2P流量分类问题已成为流量识别领域的一个新兴研究方向。利用决策树中的C4.5算法和P2P流量的特征属性来构建决策树模型,进而完成P2P流量分类问题。实验结果表明,基于决策树模型的方法能有效避免P2P网络流分布变化所带来的不稳定性;与SVM(support vector machine,支持向量机)、NBK(nave Bayes using kernel densi    

5.  决策树分类方法研究  被引次数:4
   魏晓云《计算机系统应用》,2007年第16卷第9期
   分类知识的获取是数据挖掘要实现的重要任务之一,其核心问题是解决分类模型的构造和分类算法实现.本文以决策树分类方法中有代表性的方法C 4.5为例,介绍数据挖掘中一种分类方法-决策树分类方法及其构建和应用研究.    

6.  基于改进的C4.5算法的网络流量分类方法  
   周剑峰  阳爱民  刘吉财《计算机工程与应用》,2012年第48卷第5期
   在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。    

7.  一种基于神经网络集成的决策树构造方法  
   苏晓影  贺跃  郑建军《计算机仿真》,2006年第23卷第11期
   神经网络集成方法具有比单个神经网络更强的泛化能力,却因为其黑箱性而难以理解;决策树算法因为分类结果显示为树型结构而具有良好的可理解性,泛化能力却比不上神经网络集成。该文将这两种算法相结合,提出一种决策树的构造算法:使用神经网络集成来预处理训练样本,使用C4.5算法处理预处理后的样本并生成决策树。该文在UCI数据上比较了神经网络集成方法、决策树C4.5算法和该文算法,实验表明:该算法具有神经网络集成方法的强泛化能力的优点,其泛化能力明显优于C4.5算法;该算法的最终结果昆示为决策树,显然具有良好的可理解性。    

8.  基于C4.5的HTTP隧道检测技术研究  
   王宜菲  杨亚磊  饶孟良《计算机工程与设计》,2012年第33卷第2期
   针对网络恶意软件威胁日益严重等问题,研究了恶意软件常采用的通信方式——隧道技术,并提出了一种基于C4.5的HTTP隧道检测算法.该算法采用决策支持树算法C4.5提取网络流特征字段,根据特征字段生成训练数据建立HTTP隧道分类的决策树检测模型,采用该分类模型检测HTTP隧道流,为检测恶意软件提供依据.实验结果表明,与同类算法相比,该算法不依赖样本空间的分布,能准确地检测HTTP隧道流,具有良好的有效性和稳定性.    

9.  基于粗糙集和决策树法的认知无线电知识挖掘  被引次数:1
   余晓航  李磊民  黄玉清《信息与电子工程》,2010年第8卷第5期
   对粗糙集、决策树C4.5算法进行了研究,提出用粗糙集和决策树相结合的方法设计CR知识挖掘模型,并通过案例研究其可行性;利用基于MATLAB 802.11a物理层仿真平台收集的数据作为CR感知样值,通过样本值训练决策树序列,构建决策树提取知识,并用混淆矩阵法对设计模型的准确性及性能进行评价。实验结果表明,该方法设计模型的分类准确率高,增强了知识的可解释性,能够初步达到认知无线电知识挖掘和对以往经验学习的目的。    

10.  基于代价敏感决策树的网络流量分类研究  
   吴耿  李杰  杨文保《电脑与信息技术》,2011年第19卷第5期
   传统的基于端口的流量分类方法和基于DPI技术的流量分类方法由于P2P技术和加密技术的流行而开始失效。基于网络流特征及机器学习的流量分类方法因为克服了上述弊端而成为了流量分类领域的研究热点。实际网络环境中,"大象流"和"老鼠流"在数量和传输字节量等方面存在着严重的不平衡,降低了基于机器学习流量分类方法的实际分类效果。针对该问题,文章将代价敏感决策树C4.5_cs算法应用于网络流量的分类当中。实验证明,文章采用的方法具有更高的"字节分类准确率",适合于不平衡网络流量的分类。    

11.  一种健壮有效的决策树改进模型  被引次数:3
   刘鹏《计算机工程与应用》,2005年第41卷第33期
   论文提出了一种健壮有效的决策树改进模型R-C4.5及其简化版本。该决策树模型基于著名的C4.5决策树模型,但在属性的选取和分枝策略上进行了改进。对每一个属性计算对应样本子集的熵和样本子集熵的平均值,并将样本子集熵的值不小于平均值的样本子集进行合并,形成一个临时的复合样本子集,即合并分类效果较差的分枝。利用临时复合样本子集的熵值和未合并样本子集的熵值计算该结点的修正信息增益,并选择具有最高修正信息增益的属性作为当前结点的测试属性。其分枝对应于未合并样本子集和复合样本子集。该模型的简化版本在数据预处理阶段完成。R-C4.5决策树模型在提高测试属性选择度量的可解释性、减少空枝和无意义分枝,及过度拟合等方面有了显著的提高。    

12.  基于TAN的网络流量分类方法  
   张立仿  张喜平  柴旭清  闫娟《计算机工程与设计》,2011年第32卷第12期
   针对传统的基于传输层端口和基于特征码的流量分类技术准确率低、应用范围有限等缺点,提出了使用树扩展的贝叶斯分类器的方法,该方法利用网络流量的统计属性和基于统计理论的贝叶斯方法构建分类模型,并利用该模型对未知流量进行分类。实验分析了不同权值、不同规模的数据集对其性能的影响,并与NB、C4.5算法做了比较。实验结果表明,该方法具有较好的分类性能和较高的分类准确率。    

13.  两层聚类的类别不平衡数据挖掘算法  
   胡小生  张润晶  钟勇《计算机科学》,2013年第40卷第11期
   类别不平衡数据分类是机器学习和数据挖掘研究的热点问题。传统分类算法有很大的偏向性,少数类分类效果不够理想。提出一种两层聚类的类别不平衡数据级联挖掘算法。算法首先进行基于聚类的欠采样,在多数类样本上进行聚类,之后提取聚类质心,获得与少数类样本数目相一致的聚类质心,再与所有少数类样例一起组成新的平衡训练集,为了避免少数类样本数量过少而使训练集过小导致分类精度下降的问题,使用SMOTE过采样结合聚类欠采样;然后在平衡的训练集上使用K均值聚类与C4.5决策树算法相级联的分类方法,通过K均值聚类将训练样例划分为K个簇,在每个聚类簇内使用C4.5算法构建决策树,通过K个聚簇上的决策树来改进优化分类决策边界。实验结果表明,该算法具有处理类别不平衡数据分类问题的优势。    

14.  基于决策树的被动操作系统识别技术研究  
   易运晖  刘海峰  朱振显《计算机科学》,2016年第43卷第8期
   操作系统识别是网络安全评估的关键技术之一,在网络安全威胁和风险日益加剧的形势下,其研究具有非常重要的意义。针对当前基于TCP/IP协议栈指纹库的操作系统识别技术难以辨识未知指纹所对应的操作系统的问题,提出了基于C4.5决策树模型的被动操作系统识别方法,并将它与其他分类算法进行了比较。通过实验测试验证了分类方法的有效性,并对其结果进行了分析。    

15.  一种基于C4.5决策树的VoIP流量识别方法  
       陈福才  李海涛《计算机应用研究》,2012年第29卷第9期
   针对互联网中常见的VoIP应用类型,重点从分类特征的选取出发,提出了一种基于C4.5决策树算法的VoIP流量识别方法,并分别利用模拟数据和真实网络数据对其进行了测试。结果表明,该方法识别准确率高,对含有不同协议种类VoIP的网络数据具有较强的适应能力。    

16.  一种基于C4.5决策树的Web页面分类算法  
   曹薇  张乃洲《计算机系统应用》,2010年第19卷第10期
   WEB文本自动分类在很多方面都有着重要的应用,如信息检索,新闻分类等。决策树算法是一种简单并且广泛使用的分类方法,具有很多优点如:分类精度高,分类速度快等。主要研究了运用C4.5决策树构建Web页面分类器的基本方法和过程,并提出了一个基于C4.5决策树的Web页面分类器的框架。在此基础上实现了一个运用于网络爬虫的Web页面分类器,实验结果表明该算法是非常有效的。    

17.  分类不平衡协议流的机器学习算法评估与比较  
   张宏莉  鲁刚《软件学报》,2012年第23卷第6期
   网络协议流不平衡环境下,流样本分布的变化对基于机器学习的流量分类器准确性及稳定性有较大的影响选择合适的机器学习算法以适应网络协议流不平衡环境下的在线流量分类,显得格外重要.为此,首先通过单因子实验设计,验证了C4.5决策树、贝叶斯核估计(NBK)和支持向量机(SVM)这3种分类算法统计TCP连接开始的前4个数据包足以分类流量.接着,比较了上述3种分类算法的性能,发现C4.5决策树的测试时间最短,SVM分类算法最稳定.然后,将Bagging算法应用到流量分类中.实验结果表明,Bagging分类算法的稳定性与SVM相似,且测试时间与建模时间接近于C4.5决策树,因此更适于在线分类流量.    

18.  基于SMOTE和决策树算法的电力变压器状态评估知识获取方法  
   谢桦  陈俊星  赵宇明  丁庆  张沛《电力自动化设备》,2020年第40卷第2期
   提出基于合成少数过采样技术(SMOTE)算法和决策树算法的电力变压器状态评估知识获取方法,首先针对变压器非正常状态样本数量较少的情况,采用SMOTE算法补充非正常状态样本数量,解决了变压器样本集类别不平衡问题。然后将变压器状态评估过程视为分类过程,利用决策树模型为白箱模型的特点,将变压器状态评估知识获取问题转化为构建决策树的问题。最后采用C4.5决策树算法构建决策树,从中提取变压器状态评估知识,得到关键变压器状态量和评估规则。以某地市级供电公司110 kV电压等级油浸式变压器实际数据开展实例分析,结果表明所提出的方法能实现状态评估知识的自动化获取,可以为该地区110 kV油浸式变压器的状态评估工作提供决策支持。    

19.  基于不平衡数据集的级联决策树改进算法  
   郭鹏  葛玮《计算机工程》,2009年第35卷第24期
   提出一种针对客户离网问题的改进决策树分类算法——M-AdaBoost级联决策树。采用级联式的思想构造多个基于AdaBoost决策树分类器,通过设定子分类器的判决信息,组合成级联式决策树。实验结果表明,该方法相对于单一的C4.5决策树、传统的AdaBoost决策树以及随机森林具有更好的分类效果。    

20.  条件贝叶斯网络分类器及其在产品故障率等级分类中的应用  
   蔡志强  孙树栋  Bernard Yannou  司书宾《计算机集成制造系统》,2010年第16卷第2期
   针对传统贝叶斯网络分类器模型的不足,提出了一种基于条件贝叶斯网络的分类器模型。通过分析贝叶斯网络模型给定目标变量时各特征变量间的条件独立关系,充分利用其关联关系,为解决分类问题提供了一条有效途径。在此基础上,提出了基于条件贝叶斯网络分类器模型的建模方法用于指导实际模型建立和应用。实例分析结果表明,条件贝叶斯网络与其他的贝叶斯网络分类器及传统的决策树C4.5分类器相比,在提高分类器分类精度的同时降低了网络模型结构复杂度。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号