首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 968 毫秒
1.
基于熵的决策树分枝合并算法   总被引:10,自引:0,他引:10  
目前,基于逻辑的示例学习算法主要分两大类,决策树算法和基于规则的算法,前者以ID3为代表,ID3使用“信息熵”作启发式得出较小的决策树,但ID3算法只注意到减少树的深度,忽视树的宽度,本文给出了一种决策树分枝合并算法。可减少决策树的宽度,从而得出比ID3更好的结果。  相似文献   

2.
基于决策树的ID3算法与C4.5算法   总被引:1,自引:0,他引:1  
论述了在数据挖掘中基于决策树的ID3算法以及C4.5算法,说明了两种算法的优缺点.通过实例解析了ID3算法和C4.5算法的实现过程,能够直观看出C4.5算法相比较与ID3算法的优越性.  相似文献   

3.
ID3算法是示例学习中建立决策树的一种重要的方法.介绍了 ID3决策树算法的基本思想,讨论了ID3决策树算法中的难点和不足,结合实例给出了利用信息增益度法来改进ID3算法的详细过程.  相似文献   

4.
提出了一种改进的SLIQ决策树分类算法,克服了原有SLIQ算法需要大量计算决策树每个节点的吉尼指数(gini index)的缺点.改进的SLIQ算法能够有效地减少计算的复杂度.结合实例,将该算法与原有SLIQ算法和基于人工神经网络的分类算法应用结果进行比较,实验结果表明该算法的分类准确率远远高于SLIQ算法和基于人工神经网络的分类算法.  相似文献   

5.
Quinlan学习算法所生成的决策树在有些情形下不是最优的.本文给出一种逐层递归下降前探的决策树优化算法,保证在这些情形下所学习到的决策树也是最优的.  相似文献   

6.
针对HiCuts算法在NIDS应用上存在着空间异常膨胀和决策树不平衡性的问题,提出了一种P-Hi-Cuts算法.P-HiCuts(Pruned HiCuts)对原报文空间分组算法进行改进,采用覆盖规则上提和非均匀切分的技术解决原有问题,从理论上减小了决策树深度.实验结果显示,改进后决策树深度空间占用缩小到原来的10%,分类速度也提升了13.71%.  相似文献   

7.
基于ID3算法的考试成绩分析决策树的构造   总被引:1,自引:0,他引:1  
决策树是数据挖掘任务中分类的常用算法,ID3算法是决策树学习的核心算法.论述了ID3算法的基本思想和实现方法,分析了节点选择的方法,并根据ID3算法构造了考试成绩分析决策树,同时针对算法的缺点提出了改进意见.  相似文献   

8.
为从理论层次上深度解析决策树分类算法的逻辑可行性,根据可拓理论中可拓逻辑和可拓思维的全新视角,对构建决策树过程中节点的选择、规则提取和预测等步骤,进行理论上的分析和评价.以可拓思维中的菱形思维模式来分析决策树算法中节点的选择,以可拓逻辑中基元变换理论来评价决策树算法的规则提取,以可拓逻辑中的基元发散规则来解释决策树算法的预测步骤,在验证决策树算法各个步骤符合可拓理论处理矛盾问题的思维模式的同时,也对决策树算法的分类结果建立了基于可拓理论的评价体系.  相似文献   

9.
主要阐述了决策树学习算法在交通方式选择模型中的应用.在基本决策树的基础上,使用随机森林组合学习算法来建立交通方式选择模型,以Bagging预测方法和CART算法为主,以随机特征选择和"投票"方法为辅,并相互融合,结合具体实例详细介绍该模型的建立,从数据的选择到整个森林中树的数目和每个结点处抽取的候选属性的个数调整,并对模型进行了相应的评估.实验结果表明,随机森林预测精度高,且对噪声数据具有较强的稳健性,采用决策树学习算法得出的规则在交通方式选择的分析中具有较好的实用价值.  相似文献   

10.
决策树作为一种数据挖掘分类算法,不仅可以根据现存的数据库信息得出分类规则,而且可以通过友好的图形界面进行结果展示.城建档案馆在档案催交管理工作中,收集了大量的数字化信息,文中运用 C4.5 算法针对催交信息构造决策树,并利用生成的决策树辅助城建档案馆进行档案的催交管理.  相似文献   

11.
Iterative Dichotomiser version3(ID3)算法是数据挖掘中经典的决策树分类算法,其核心是分裂训练集属性的选择标准,即分裂前后的信息增益量最大,用该标准选择属性时对于取值较多的属性具有较强依赖性。剖析了ID3算法存在的不足并加以改进,引入了属性关注度,提出了改进算法AAID3算法。实验表明改进算法对原ID3算法的取值偏向问题有所克服并使分类更加准确,决策树更加简明。  相似文献   

12.
基于分类问题的特点,设计了适用于分类问题的类电磁机制算法,然后设计了基于改造后的类电磁机制算法的最优决策树生成算法,用以解决支持向量机多分类问题.以最大分类间隔为准则,利用类电磁机制算法进行优化,从而生成最优或次优的决策树.在每个决策结点利用传统的支持向量机二分类方法进行分类,最终实现支持向量机多分类.仿真结果表明:这种方法比传统的1-a-1,1-a-r,DAG-SVM,DT-SVM以及GADT-SVM方法有更优的性能.  相似文献   

13.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

14.
SVM决策树能够较好地进行Web文本信息分类,在此基础上进一步结合遗传算法,将SVM决策树分类器的分类正确率作为GA适应度函数,对SVM决策树层次结构进行优化,在每一决策节点自动选择最优或近优的分类决策。实验结果表明,采用该方法进行多类分类,分类精度明显提高,体现了将遗传算法与SVM决策树结合的优越性。  相似文献   

15.
阐述数据挖掘的决策树算法,对ID3算法基本理论和原理进行介绍。运用该算法对教师教学质量测评数据进行分析,构造出质量测评数据决策树模型。  相似文献   

16.
当前信用评级普遍采用的传统方法如专家法、信用评分法中,属性的权重大小受评价者主观影响大,可能造成评价结果偏差失准,并增加评价的时间消耗。本文将决策树模型引入信用评级体系中,在道路客运行业信用评级体系中建立一种新的评价方法。结果表明,采用ID3算法的决策树方法通过定量计算训练集样本中各属性互信息的大小,可以迅速地得到一棵决策树,从而通过对训练样本的统计计算避免了主观判断属性权重带来的弊端。当该决策树经过全面、良好的测试和调整后,可足够健壮,能较好地运用于信用评价。  相似文献   

17.
决策树在垃圾邮件过滤中的应用   总被引:1,自引:0,他引:1  
介绍了垃圾邮件过滤技术,对决策树算法的基本思想进行阐述,分析比较其优点和不足,给出了基于ID5R算法的垃圾邮件过滤模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号