首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
一种改进的PEP决策树剪枝算法   总被引:1,自引:0,他引:1  
剪枝过程是决策树分类学习中的重要环节,能够简化决策树并提高决策树的泛化能力,避免对训练数据集的过适应。在PEP算法的基础上,本文提出了一种改进的决策树剪枝算法IPEP,实验结果表明,该算法剪枝效果较PEP算法更好。  相似文献   

2.
分析决策树的基本模型,给出决策树的方法概述.进一步对决策树的算法进行了深入的分析,最后给出了构建决策树.并且应用决策树进行线性分类和2次分类,进行了算法的实践.  相似文献   

3.
决策树是数据挖掘技术中的重要方法,主要用于分类和预测.本文介绍了决策树算法中应用最广泛的ID3算法和C4.5算法,阐述了两种算法的主要思想,说明了构造决策树的基本步骤,对两种算法进行了分析和比较.  相似文献   

4.
决策树方法是一种重要的可完成分类任务的知识发现技术 ,目的是通过构造一个分类模型 ,把数据库中的元组映射到给定类别中的某一个。决策树分类算法效率高且应用广泛 ,但是不能处理在决策树的构建和分类过程中的不确定数据。针对决策树分类算法的局限 ,利用证据理论是对概率论的扩展 ,将置信函数与概率的上下值相联系 ,可用于不确定数据的表达这个有力工具 ,把决策树分类技术扩展到含有不确定数据的环境中 ,提出了 D- S决策树分类算法。实验结果表明 D- S决策树分类算法能有效的对不确定数据进行分类。  相似文献   

5.
为从理论层次上深度解析决策树分类算法的逻辑可行性,根据可拓理论中可拓逻辑和可拓思维的全新视角,对构建决策树过程中节点的选择、规则提取和预测等步骤,进行理论上的分析和评价.以可拓思维中的菱形思维模式来分析决策树算法中节点的选择,以可拓逻辑中基元变换理论来评价决策树算法的规则提取,以可拓逻辑中的基元发散规则来解释决策树算法的预测步骤,在验证决策树算法各个步骤符合可拓理论处理矛盾问题的思维模式的同时,也对决策树算法的分类结果建立了基于可拓理论的评价体系.  相似文献   

6.
决策树方法是一种重要的可完成分类任务的知识发现技术,目的是通过构造一个分类模型,把数据库中的元组映射到给定类别中的某一个。决策树分类算法效率高且应用广泛,但是不能处理在决策树的构建和分类过程中的不确定数据。针对决策树分类算法的局限,利用证据理论是对概率论的扩展,将置信函数与概率的上下值相联系,可用于不确定数据的表达这个有力工具,把决策树分类技术扩展到含有不确定数据的环境中,提出了D-S决策树分类算法。实验结果表明D-S决策树分类算法能有效的对不确定数据进行分类。  相似文献   

7.
在粗糙集理论的基础上提出了一种新的决策树算法,把粗糙集中的近似分类精度及决策规则的确定性因子应用于决策树的构造,在算法形成的过程中提出抑制因子,对决策树进行修剪,避免了先生成决策树再修剪的繁琐步骤,且在每次划分时对条件属性值和决策属性值进行匹配考察,避免不必要的计算,进一步提高了算法速度.  相似文献   

8.
基于ID3算法的考试成绩分析决策树的构造   总被引:1,自引:0,他引:1  
决策树是数据挖掘任务中分类的常用算法,ID3算法是决策树学习的核心算法.论述了ID3算法的基本思想和实现方法,分析了节点选择的方法,并根据ID3算法构造了考试成绩分析决策树,同时针对算法的缺点提出了改进意见.  相似文献   

9.
基于熵的决策树分枝合并算法   总被引:10,自引:0,他引:10  
目前,基于逻辑的示例学习算法主要分两大类,决策树算法和基于规则的算法,前者以ID3为代表,ID3使用“信息熵”作启发式得出较小的决策树,但ID3算法只注意到减少树的深度,忽视树的宽度,本文给出了一种决策树分枝合并算法。可减少决策树的宽度,从而得出比ID3更好的结果。  相似文献   

10.
阐述数据挖掘的决策树算法,对ID3算法基本理论和原理进行介绍。运用该算法对教师教学质量测评数据进行分析,构造出质量测评数据决策树模型。  相似文献   

11.
以电力公司的业务需求为背景,为实现电力设备的状态诊断,以数据挖掘技术中的粗糙集和决策树算法为依据,采用粗糙集和决策树相结合的数据处理模型对电力设备的各属性数据进行了分析处理。综合运用粗糙集和决策树两种数据挖掘算法,通过粗糙集技术进行属性约简,并运用决策树的ID3算法对约简后的数据进行分枝、减枝得到规则集,实现对电力设备工作状态的快速、高效诊断,并根据其工作状态提供决策支持。  相似文献   

12.
为了使构造的决策树更简单,规则更容易被理解且精度更高,文章基于粗糙集理论提出了一种对属性约简及泛化的多变量决策树算法。该方法采用条件属性的加权平均粗糙度这个指标来选择测试属性构造决策树。实验表明该方法较ID3算法得到的决策树更小且分类准确率更高。文章还展望用核属性以外的条件组合属性作测试属性构造更简化的多变量决策树。  相似文献   

13.
ID3算法是示例学习中建立决策树的一种重要的方法.介绍了 ID3决策树算法的基本思想,讨论了ID3决策树算法中的难点和不足,结合实例给出了利用信息增益度法来改进ID3算法的详细过程.  相似文献   

14.
决策树剪枝是将已生成的决策树进行简化的过程,包括预剪枝和后剪枝。为了提高后剪枝算法MEP的剪枝精度,防止因MEP影响因子选取不当造成决策树修剪过度而丢失特征信息的问题,提出一种改进的MEP算法即IMEP方法。首先引入k-折交叉验证(k-Fold Cross-Validation)方法用于选取最优的影响因子m,然后将m带入到MEP算法,再对原始决策树进行剪枝,可以得到最精确的决策树,并保持决策树的影响特征。其次,通过k次交叉验证,可以避免产生过拟合问题,和单独测试集方法相比,经过k次交叉验证后,已经减弱了随机性,防止出现"欠学习"问题。经过验证IMEP方法不仅提高了MEP的精度,能更精准简化决策树,并且保持决策树的影响特征。相比于PEP算法,在数据集较小时有更好的适用性,表现更加稳定。  相似文献   

15.
介绍了数据挖掘原理及决策树分类方法,对ID3算法的基本思想和具体实现方法进行阐述,并在根据天气决定是否打网球的应用中运用该算法,最终构造出决策树模型。  相似文献   

16.
Quinlan学习算法所生成的决策树在有些情形下不是最优的.本文给出一种逐层递归下降前探的决策树优化算法,保证在这些情形下所学习到的决策树也是最优的.  相似文献   

17.
基于决策树数据挖掘的分析与应用   总被引:1,自引:1,他引:0  
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

18.
决策树算法是数据挖掘中重要的分类算法,但目前多数针对决策树的改进方法都基于传统的串行算法,不能满足大数据环境下对海量数据挖掘的需要.针对大数据集中串行挖掘算法效率低下的问题,采用MapReduce对决策树算法进行了并行化实现,同时引入修正参数来改进ID3算法倾向于多值属性选取的问题.实验结果表明,该算法具有较好的并行性和扩展性,能有效处理大数据集的分类问题.  相似文献   

19.
当前信用评级普遍采用的传统方法如专家法、信用评分法中,属性的权重大小受评价者主观影响大,可能造成评价结果偏差失准,并增加评价的时间消耗。本文将决策树模型引入信用评级体系中,在道路客运行业信用评级体系中建立一种新的评价方法。结果表明,采用ID3算法的决策树方法通过定量计算训练集样本中各属性互信息的大小,可以迅速地得到一棵决策树,从而通过对训练样本的统计计算避免了主观判断属性权重带来的弊端。当该决策树经过全面、良好的测试和调整后,可足够健壮,能较好地运用于信用评价。  相似文献   

20.
基于决策树的英语四级成绩分析   总被引:1,自引:0,他引:1  
阐述了数据挖掘流程的基本概念,介绍了决策树算法的原理,根据决策树算法分析了影响高校英语四级成绩的诸多因素,对这些因素按照数据挖掘思想生成了规则集,为提高教学质量奠定了基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号