共查询到20条相似文献,搜索用时 140 毫秒
1.
决策树算法及其核心技术 总被引:12,自引:0,他引:12
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。概述了决策树分类算法,指出了决策树算法的核心技术:测试属性的选择和树枝修剪技术。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较,总结出了各种算法的特性,为使用者选择算法或研究者改进算法提供了依据。最后,通过一个实例说明决策树分类在实际生产中的应用。 相似文献
2.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。 相似文献
3.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的ID3算法结构简单,并且能提高分类效率。 相似文献
4.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的IDB算法结构简单,并且能提高分类效率。 相似文献
5.
它概述了数据挖掘的几种常用算法,在权衡利弊的情况下,选择了决策树算法,它的优点是描述简单、分类速度快.特别适合大规模的数据处理,另外,以其易于提取显式规则、计算量相对较小、可以显示重要的决策属性和具有较高的分类准确率,综合以上优点及教学评估数据的结构化特性,选择分类技术中的决策树方法用于教学评估数据挖掘系统。 相似文献
6.
它概述了数据挖掘的几种常用算法,在权衡利弊的情况下,选择了决策树算法,它的优点是描述简单、分类速度快,特别适合大规模的数据处理,另外,以其易于提取显式规则、计算量相对较小、可以显示重要的决策属性和具有较高的分类准确率,综合以上优点及教学评估数据的结构化特性,选择分类技术中的决策树方法用于教学评估数据挖掘系统。 相似文献
7.
基于MapReduce的决策树算法并行化 总被引:1,自引:0,他引:1
针对传统决策树算法不能解决海量数据挖掘以及ID3算法的多值偏向问题,设计和实现了一种基于MapReduce架构的并行决策树分类算法。该算法采用属性相似度作为测试属性的选择标准来避免ID3算法的多值偏向问题,采用MapReduce模型来解决海量数据挖掘问题。在用普通PC搭建的Hadoop集群的实验结果表明:基于MapReduce的决策树算法可以处理大规模数据的分类问题,具有较好的可扩展性,在保证分类正确率的情况下能获得接近线性的加速比。 相似文献
8.
张晓 《电脑编程技巧与维护》2011,1(16):110-111,124
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。将C4.5算法应用于高校财务预警系统的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在高校财务预警调查数据分析中具有广泛的应用前景。 相似文献
9.
决策树算法是数据挖掘中常用的重要方法,广泛应用于分类和预测。本文对决策树的ID3算法的基本思想进行了介绍,通过应用实例说明了构造决策树的实现过程。 相似文献
10.
11.
非确定树模式挖掘已经成为一个重要的研究课题,提出一种非确定树模式挖掘算法,有效地解决了在实际应用中树的非确定性问题。其基本思想为:提出非确定树蕴含集、确定树概率和非确定期望支持度等概念,提出将非确定树的期望支持度作为树的支持度,提出非确定树支持度计算方法,利用哈希表能快速匹配的特性降低求解期望支持度过程中树同构判定的时间复杂度,提出非确定树挖掘层次搜索空间,使得非确定树挖掘快速而精确。实验结果表明,提出的非确定树挖掘算法有效可行且具有显著的运行效率。 相似文献
12.
先给出了决策树挖掘算法和算法的改进思路,进而结合CRM的实例,详细分析了决策树构建过程和采用的处理措施,提出了将决策树挖掘用于CRM的思路,选择决策树构建评价指标的方法。通过实验进行验证,结果表明该方法是可行和有效的,为商家提供了一种新的分析思路。 相似文献
13.
14.
15.
16.
数据挖掘是一种重要的数据分析方法,决策树是数据挖掘中的一种主要技术,如何构造出最优决策树是许多研究者关心的问题。本文通过Rough集方法对决策表进行属性约简和属性值约简,去除决策表中与决策无关的冗余信息。在简化的决策表基础上构造近似最优决策树,本文给出了近似最优决策树的生成算法,并通过实例说明。 相似文献
17.
决策树在XML数据库挖掘中的研究 总被引:2,自引:1,他引:1
传统数据挖掘是基于关系型数据库的,XML技术的出现,使它在短时间内成为表示和交换信息的标准,为数据挖掘提供了新的方法.对决策树、XML技术作了简要介绍,并对基于XML的数据挖掘基本过程进行了探讨研究,提出了一种决策树在XML数据库挖掘的分析模型.最后,通过一个实例来说明如何利用这个模型进行数据挖掘,并指明了今后的研究方向. 相似文献
18.
19.
决策树是机器学习和数据挖掘领域中一种基本的学习方法。文中分析了C4.5算法以及该算法不足之处,提出了一种决策树裁剪算法,其中以规则信息量作为判断标准。实验结果表明这种方法可以提高最终模型的预测精度,并能够很好克服数据中的噪音。 相似文献
20.
为了高效地从半结构化WEB数据中挖掘频繁模式树,提出了把半结构化数据表示为标记、有序树,并基于最右路径扩展技术在有序树中发现所有频繁模式树的算法.其基本思想是,首先从只有一个节点的模式树开始,而新增节点只能通过添加到最右路径上来生成新的模式树,另外,还通过维护最右叶子出现次数列表来实现支持度的逐步计算.理论分析和试验结果表明该算法是可行的,并且具有计算性能线性于最大频繁模式总和的优点. 相似文献