共查询到20条相似文献,搜索用时 15 毫秒
1.
阐明决策树分类器在用于分类的数据挖掘技术中依然重要,论述基于决策树归纳分类的ID3、C4.5算法,并且对决策属性的选取法则进行说明。通过实例解析ID3、C4.5算法实现过程,结果表明C4.5算法相比较于ID3算法的优越性.尤其在处理具有多属性值的数据时的更加合理和正确。 相似文献
2.
基于C4.5挖掘算法的纳税评估模型设计 总被引:1,自引:0,他引:1
介绍应用C4.5挖掘算法进行行业理论税负测算的理论依据,为了提高算法的计算效率,结合税收领域知识对挖掘算法进行了改进,利用改进后的算法实现了行业理论税负的测算. 相似文献
3.
C4.5决策树展示算法的设计 总被引:10,自引:1,他引:10
分析了现有的展示C4.5算法结果决策树的方法的不足,设计了一种利用多叉树结构的直接输出来实现决策树展示的算法。在客户关系管理(CRM)应用于电信运营的研究项目中,该算法在数据挖掘平台上得到应用,实践证明,提高了决策树分类的效率和展示的直观性。 相似文献
4.
5.
并行决策树算法的研究 总被引:5,自引:0,他引:5
数据挖掘在科研和商业应用中正发挥着越来越重要的作用。随着数据量的增加,数据挖掘工具处理海量数据的能力问题显得日益突出。研究并行算法,是解决这个问题的有效途径。分类器是数据挖掘的一种基本方法,决策树是一种最重要的分类器。文章首先介绍了分类器中的决策树算法,然后设计了一种并行决策树算法,最后探讨了该并行算法在PVM系统下的实现。 相似文献
6.
数据挖掘中决策树加权模糊熵算法 总被引:2,自引:0,他引:2
决策树算法是数据挖掘技术领域的一种重要算法 ,唐华松、姚耀文在利用熵和加权和思想的基础上提出了一种加权熵算法 ,但是此算法在解决模糊问题上有其不足之处 ,我们在加权熵算法的基础上利用模糊理论建立了一种加权模糊熵算法 ,较好的解决了这一问题。 相似文献
7.
决策树模型是数据挖掘中最常用的一种方法,具有较好的分类预测能力,并能方便提取决策规则。基于相似性原理,以测试属性和决策属性的相似度作为启发规则构建决策树。提出了一种新的决策树生成算法。并在高校教师综合考评系统中采用了这种新算法,实验结果表明这种新的决策树生成算法预测精度较高,计算也比较简便。 相似文献
8.
9.
对如何将数据挖掘技术应用于成绩分析的问题进行了研究。通过调查淮北职业技术学院08级学生学习《数据结构》的学习情况,与现有的成绩分析方法完全不同的角度,通过采用数据挖掘中的C4.5算法,建立了学生成绩分析决策树模型,并提取了分类规则,可以对今后的教学工作发挥积极的指导作用,实验结果及分析表明了该方法的有效性。 相似文献
10.
11.
运用高校学生成绩、学籍等相关数据,创建高校学生成绩分析的数据仓库,运用ID3算法实现基于学生成绩等级的决策树挖掘模型的构建,由决策树提取分类规则,并利用Analysis Services工具进行挖掘验证. 相似文献
12.
决策树算法及其在乳腺疾病图像数据挖掘中的应用 总被引:5,自引:1,他引:5
介绍了ID3决策树算法建立决策树的基本原理,着重介绍了决策树的修剪问题和两种典型的修剪算法-减少分类错误修剪算法和最小代价-复杂度修剪算法,并利用介绍的决策树算法和修剪算法对乳腺疾病图像进行数据挖掘,得到了一些有实际参考价值的规则,获得了很高的分类准确率,证明了决策树算法在医学图像数据挖掘领域有着广泛的应用前景。 相似文献
13.
张晓 《电脑编程技巧与维护》2011,1(16):110-111,124
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。将C4.5算法应用于高校财务预警系统的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在高校财务预警调查数据分析中具有广泛的应用前景。 相似文献
14.
郭四稳 《计算机与数字工程》2006,34(9):25-27
分类决策树的归纳是一种重要的数据挖掘算法。本文重点介绍了两种基于并行算法的分类决策树的构造算法,并对它们的适用性及特点作了分析。 相似文献
15.
决策支持系统是一个基于计算机的人机交互决策制定系统,其技术已从早期的以数据、信息为中心发展到现代的以知识和智能为中心的高级决策支持系统。以决策支持系统中采用的数据挖掘技术作为考察角度,探讨数据挖掘和决策支持系统之间的关系。 相似文献
16.
17.
C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运行效率. 相似文献
18.
在数据挖掘中,分期是一个很重要的问题,有很多流行的分类器可以创建决策树木产生类模型。本文介绍了通过信息增益或熵的比较来构造一棵决策树的数桩挖掘算法思想,给出了用粗糙集理论构造决策树的一种方法,并用曲面造型方面的实例说明了决策树的生成过程。通过与ID3方法的比较,该种方法可以降低决策树的复杂性,优化决策树的结构,能挖掘较好的规则信息。 相似文献
19.
将C4.5决策树分类算法用于高职就业预测,并提取挖掘规则。对学生基本信息、各科考试成绩,以及就业信息进行处理,选取决策属性,构造决策树,由提取的规则,获得就业和学生成绩之间的关系,挖掘结果显示,该算法能将学习成绩属性和是否是学生干部属性进行正确分类,做出一定的就业预测,对辅助决策具有一定的帮助。 相似文献