共查询到20条相似文献,搜索用时 561 毫秒
1.
基于信息论的决策树算法探讨 总被引:5,自引:0,他引:5
信息论是数据挖掘技术的重要指导理论之一,是决策树算法实现的理论依据.决策树算法是一种逼近离散值日标函数的方法,其实质是在实例学习的基础上,得到分类规则.本文简要介绍信息论的基本原理,重点阐述基于信息论的决策树算法,分析了它们目前主要的代表理论以及存在的问题. 相似文献
2.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的IDB算法结构简单,并且能提高分类效率。 相似文献
3.
基于粗糙集合理论的决策树生成 总被引:4,自引:1,他引:3
决策树算法是一种采用发治策略的自顶向下的归纳算法,传统的决策树算法往往是基于信息论度量的。文章以粗糙集合理论中的区分观点为基础,提出了两种新型的属性选择判据:区分度和区分价值。实验结果表明,采用区分价值的属性选择策略所生成的决策树要明显优于基于熵的属性选择策略。 相似文献
4.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的ID3算法结构简单,并且能提高分类效率。 相似文献
5.
决策树算法是一种采用分治策略的自顶向下的归纳算法,传统的决策树算法往往是基于信息论度量的.文章以粗糙集合理论中的区分观点为基础,提出了两种新型的属性选择判据:区分度和区分价值.实验结果表明,采用区分价值的属性选择策略所生成的决策树要明显优于基于熵的属性选择策略. 相似文献
6.
7.
8.
9.
决策树归纳学习算法是机器学习领域中解决分类问题的最有效工具之一。由于决策树算法自身的缺陷了,因此需要进行相应的简化来提高预测精度。模糊决策树算法是对决策树算法的一种改进,它更加接近人的思维方式。文章通过实验分析了模糊决策树、规则简化与模糊规则简化;模糊决策树与模糊预剪枝算法的异同,对决策树的大小、算法的训练准确率与测试准确率进行比较,分析了模糊决策树的性能,为改进该算法提供了一些有益的线索。 相似文献
10.
杨宝华 《数字社区&智能家居》2006,(11):180-181
决策树是对未知数据进行分类预测的一种方法。本文阐述熵理论和典型的ID3算法,并举例构建决策树。讨论选择具有最高信息增益的属性构建决策树,即选定具有最高区分度的属性作为当前节点。利用熵理论构建决策树,方法简单,结构清晰,容易转换成分类规则,并且不需要先验领域知识。 相似文献
11.
12.
决策树学习算法ID3的研究 总被引:28,自引:0,他引:28
ID3是决策树学习的核心算法,为此详细叙述了决策树表示方法和ID3决策树学习算法,特别说明了决策属性的选取法则。通过一个学习实例给出该算法第一选取决策属性的详细过程,并且对该算法进行了讨论,一般情况下,ID3算法可以找出最优决策树。 相似文献
13.
14.
决策树算法及其核心技术 总被引:12,自引:0,他引:12
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。概述了决策树分类算法,指出了决策树算法的核心技术:测试属性的选择和树枝修剪技术。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较,总结出了各种算法的特性,为使用者选择算法或研究者改进算法提供了依据。最后,通过一个实例说明决策树分类在实际生产中的应用。 相似文献
15.
良好的教师资源是高校持续发展的重要保证。文中分析了当前高校教师资源管理中存在的问题,进而把融合了模糊理论和决策树优点的模糊决策树应用到这一领域;简要介绍了模糊决策树构造思想和Fuzzy ID3决策树学习算法,并将该思想和算法运用于高校师资管理之中,对引起高校教师资源流失的原因进行了初步分析。以若干高校提供的数据为基础的实验表明,本方法产生的分类结果基本符合实际情况,从而也为高校如何解决师资流失问题提供了理论依据。 相似文献
16.
ID3算法的研究与应用 总被引:1,自引:0,他引:1
决策树算法是数据挖掘领域的核心分类算法之一,其中ID3算法是最为经典的决策树算法。ID3算法理论清晰、使用简单、学习能力较强,且构造的决策树平均深度较小,分类速度较快,特别适合处理大规模的学习问题,目前已得到广泛应用。本文对ID3算法进行了详细的描述,并将该算法运用到电脑销售部门的决策中,验证了算法的性能。 相似文献
17.
隐私保密是数据挖掘应用中正迅速发展的研究领域。重点讨论了数据保密的两种方法:值一类成员关系、值变形,并在此基础上给出了保密程度量化的确定。数据挖掘的任务是研究并提出整合数据的模型,文中利用贝叶斯规则重构数据的原始分布,并将此方法应用于决策树的生成,得到了3种构建决策树的算法:全局算法、分类算法、局部算法,并且通过理论分析得出局部算法和分类算法比全局算法的效率高。 相似文献
18.
基于CBR系统事例检索算法的研究 总被引:9,自引:0,他引:9
事例检索是基于事例推理CBR系统的中心环节,检索速度和精度关系着整个系统的质量。根据应用的需要先后分析了基于数据库、ID3决策树和k—d树的事例检索算法,并在标准的k—d树算法的基础上引入聚类的概念,将原始的事例库组织成聚合中心库和类库二级结构,提出了改进的k—d树事例检索算法,理论分析和对比实验证实了改进的k—d树事例检索算法在事例检索速度上逼近ID3决策树检索算法,在检索精度上远远超过了ID3决策树检索算法和标准的k—d树检索算法,其性能开销比是四种算法中最为理想的。 相似文献
19.
20.
在数据挖掘中,分期是一个很重要的问题,有很多流行的分类器可以创建决策树木产生类模型。本文介绍了通过信息增益或熵的比较来构造一棵决策树的数桩挖掘算法思想,给出了用粗糙集理论构造决策树的一种方法,并用曲面造型方面的实例说明了决策树的生成过程。通过与ID3方法的比较,该种方法可以降低决策树的复杂性,优化决策树的结构,能挖掘较好的规则信息。 相似文献