首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
提出了基于决策树C4.5算法的面向对象分类方法.首先利用多尺度分割方法对遥感影像进行分割;然后提取对象的特征信息,包括光谱特征、纹理特征、形状特征、图层特征等,对提取的众多的对象特征,利用决策树C4.5算法对其进行知识挖掘,自动建立分类规则;最后利用建立的分类规则,将C4.5算法作为一种分类器对分割后的遥感影像进行分类,并以南充市城市土地利用为例进行了分类实验.实验验证了该方法的可行性.实验结果表明利用决策树C4.5算法建立的分类规则准确率高,利用该分类规则进行的面向对象分类效果较好.  相似文献   

2.
决策树技术是数据挖掘的重要方法,广泛应用于客户分类和预测。本文对决策树的C4.5算法的基本思想和特点进行了介绍,并结合实例说明了构造决策树的具体实现过程。  相似文献   

3.
C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运行效率.  相似文献   

4.
回归测试中测试用例的优化选择是个关键环节,借助黑盒测试中的等价类划分选择测试用例可以提高测试的效率.文中介绍一种基于决策树规则的分类方法实现等价类的划分.该方法通过决策树提取规则,在按照一定的优先级对提取的决策树规则进行排序后,对测试用例库中的每个测试用例,选择优先级最高的规则进行匹配分类,最后从每一分类中选择具有代表性的测试用例,同时介绍了怎样构造该模型.该方法在保证了分类精度的同时能够提高测试的效率,该方法是有效的.  相似文献   

5.
流量分类和识别是网络流量监测活动的重要组成部分。本文指出了传统流量分类方法的不足,分析了基于机器学习的流量分类和应用识别过程,并将决策树分类算法应用到流量分类中。实验结果表明,在保证较高准确率的同时,基于决策树算法的流量分类和识别应用还具有建模速度快,适合于在线流量分类的特点。  相似文献   

6.
随着农业现代化的发展,农业生产精细化管理要求越来越高,人们对农产品等级分类也越来越重视。将决策树算法应用到农产品蜂糖李酸甜分类中,通过对蜂糖李属性特征数据的学习训练和模型测试,得到决策树,从而实现蜂糖李酸甜有效分类。  相似文献   

7.
空间分类规则挖掘的一种决策树算法   总被引:3,自引:0,他引:3  
蔡之华  李宏  胡军 《计算机工程》2003,29(11):74-75,118
空间分类规则挖掘是空间数据挖掘研究的一个重要领域。文章提出一个空间分类规则挖掘问题,并为解决该问题介绍了一种空间分类规则挖掘的决策树算法。  相似文献   

8.
基于关联规则的决策树算法   总被引:1,自引:0,他引:1       下载免费PDF全文
汪海锐  李伟 《计算机工程》2011,37(9):104-106,109
通过将关联规则与决策树算法相结合,形成一种基于关联规则的决策树算法。该算法对不同时期同一事务的异种数据结构进行处理,得到一种可扩展的多分支分类决策树,使得改进后的决策树算法具有良好的可扩展性。该算法解决了传统分类算法在数据集维度发生变化时分类过程无法持续进行的问题。  相似文献   

9.
针对大学生计算机二级成绩影响因素的问题,运用决策树方法C4.5算法对湖北工程学院新技术学院2012级学生计算机二级成绩进行分析挖掘并生成决策树模型。通过模型分析找出分类规则总结出成绩影响因子,为今后计算机等级考试的教学工作提供指导性意见并提高考试的通过率,达到提高教学质量和促进教育教学改革的目的。  相似文献   

10.
马腾  陈庶樵  张校辉  田乐 《计算机应用》2013,33(9):2450-2454
为克服决策树算法处理高速网络、大容量规则集下的报文分类问题时内存使用量大的弊端,提出一种基于规则集划分的多决策树报文分类算法。在保证规则子集数量可控的前提下,采用启发式算法将规则集划分为有限个规则子集,最大限度分离交叠规则;提出两级级联决策树结构,降低决策树深度以减少规则查找时间。理论分析表明,该算法空间复杂度较传统单决策树算法大幅降低。仿真结果表明,该算法的内存使用量比目前空间性能最好的EffiCuts算法减少了30%,且维度可扩展性更好。  相似文献   

11.
P2P流量逐渐成为互联网流量的重要组成部分,精确分类P2P流量对于有效管理网络和合理利用网络资源都具有重要意义。近年来,利用机器学习方法处理P2P流量分类问题已成为流量识别领域的一个新兴研究方向。利用决策树中的C4.5算法和P2P流量的特征属性来构建决策树模型,进而完成P2P流量分类问题。实验结果表明,基于决策树模型的方法能有效避免P2P网络流分布变化所带来的不稳定性;与SVM(support vector machine,支持向量机)、NBK(nave Bayes using kernel densi  相似文献   

12.
隐私保护的分布式决策树分类算法的研究*   总被引:1,自引:0,他引:1  
针对分布式决策树构造过程中的隐私保护问题,引入安全多方计算方法设计了可以保护隐私的分布式C4.5决策树分类算法。该算法适用于数据集垂直分布和水平分布两种情况,同时提出了一种新的隐私保护程度的度量方法。实验结果证明设计的隐私保护分布式决策树分类算法不仅很好地保护了原始数据不泄露,同时保持了较高的分类精度。  相似文献   

13.
Apriori算法低频规则的有效性及实现   总被引:1,自引:0,他引:1  
针对经典Apriori算法基于全局、高频两个条件的缺陷,指出事务数据库低频规则的有效性,并通过对C4.5决策树的规则构造,进一步证明事务数据库存在低频规则,在此基础上,给出了一种Apriori低频规则挖掘算法。该算法与经典的Apriori算法兼容,但不是对Apriori算法简单的扩展,而是从理论上打破了Apriori算法基于全局和高频两个条件。最后通过实例用Apriori低频规则挖掘算法和C4.5算法对实例数据库进行挖掘,证明两者的一致性和Apriori低频规则的有效性,同时也证明了Apriori低频规则挖掘算法的有效性。  相似文献   

14.
针对传统C4.5算法存在容易产生冗余规则、决策树规模过大、分类速度过慢等问题,提出一种基于余弦相似度的改进C4.5决策树算法。计算每个属性的信息熵和增益率,如果任意属性的任意两个属性值的信息熵之差在一个很小范围内时,计算两个属性值的余弦相似度;合并相似度在阈值范围内的属性值,重新计算合并后属性的信息增益率,依据传统的C4.5算法进行计算。抽取某医院普检数据进行仿真,仿真结果表明,所提算法能够有效降低分裂属性维度,缩减了决策树规模,减少了冗余规则,提高了分类速度。  相似文献   

15.
通过增加一些规则来最终减少规则转换的冗余问题,并设计一种算法实现这种优化.在优化后的规则库、单维上用决策树方法查找,结果以位向量的方式存放,保持了算法的高速度,同时有效地节省了空间.  相似文献   

16.
分类规则挖掘是数据挖掘中的重要研究内容之一,概念格是提取分类规则的一种有效工具。首先,给出了一种面向分类的概念格批处理构造算法CLBCR,并从概念格内涵中提取分类规则;其次,采用条件信息熵作为分类规则的度量因子,对分类规则进行排序,从而进一步提高了分类规则的分类效率;最后,实验验证了该方法,在不影响分类正确率的同时,有效地提高了分类效率。  相似文献   

17.
提出了一种采用最小贝叶斯信息准则(Minimum Bayesian Information Criterion,MBIC)来最优化控制决策树结点分裂程度的算法。首先在理论上证明了MBIC能够较好地解决模型参数复杂度与训练数据集规模之间的权衡问题,然后给出了基于MBIC的决策树分裂停止准则的计算公式。汉语连续语音全音节识别实验表明:与传统的最大似然准则(Maximum Likeihood Criterion,MLC)相比,MBIC对声学模型参数和训练数据集的变化具有更好的适应能力。  相似文献   

18.
王燕  李明 《计算机应用》2007,27(10):2376-2378
概念格是进行数据挖掘和规则提取的有力工具,通过分析概念格中概念的特征,提出了扩展概念格以及基于扩展概念格的分类规则获取算法。实验表明该算法能够生成简洁并且易于理解的规则集。  相似文献   

19.
在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号