首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 78 毫秒
1.
决策树学习算法ID3的研究   总被引:28,自引:0,他引:28  
ID3是决策树学习的核心算法,为此详细叙述了决策树表示方法和ID3决策树学习算法,特别说明了决策属性的选取法则。通过一个学习实例给出该算法第一选取决策属性的详细过程,并且对该算法进行了讨论,一般情况下,ID3算法可以找出最优决策树。  相似文献   

2.
ID3算法及其改进   总被引:1,自引:0,他引:1  
文章对ID3算法的基本概念和原理进行了相应的详细阐述以及解释说明,并针对ID3算法倾向于取值较多的属性的缺点,引进信息增益率对ID3算法作了改进,并通过实验对改进前后的算法进行了比较,实验表明,改进后的算法行之有效。  相似文献   

3.
决策树ID3算法的改进   总被引:3,自引:0,他引:3  
本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更高的计算速度。  相似文献   

4.
罗雨滋  付兴宏 《计算机系统应用》2013,22(10):136-138,187
本文通过数据挖掘对传统ID3决策树分类算法及性能进行分析研究,‘利用高等数学中的微分理论知识,改进和优化了ID3算法中的运算速度和选择测试属性偏向问题,并进一步给出了改进算法的伪代码.  相似文献   

5.
决策树算法是数据挖掘中常用的重要方法,广泛应用于分类和预测。本文对决策树的ID3算法的基本思想进行了介绍,通过应用实例说明了构造决策树的实现过程。  相似文献   

6.
利用ID3算法建立决策树的研究   总被引:1,自引:0,他引:1  
刘春阳 《福建电脑》2008,24(7):99-100
本文主要介绍了决策树的基本思想,详细介绍了ID3算法的原理,并利用ID3算法建立了决策树,生成相应的规则。  相似文献   

7.
基于属性值的ID3算法改进   总被引:5,自引:1,他引:5  
ID3算法是数据挖掘中经典的决策树分类算法.针对ID3算法所存在的属性取值偏向问题及只时较小的数据集有效的缺点提出改进.当训练样本各属性的取值个数相差较大的情况下,在计算划分标准时引入了属性取值个数N,在一定程度上克服了ID3算法易偏向于取值较多的属性这一缺陷,得到了结构更简洁的、较为理想的决策树.采用先剪枝的方法实现改进,设定一个阈值避免决策树的完全生长,在保持分类准确率的同时,大大地提高了算法的速度.实验结果表明,改进后的算法(AVID3)对许多数据集比传统ID3算法更有效.  相似文献   

8.
ID3算法的一种改进算法   总被引:38,自引:5,他引:33  
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。ID3算法是决策树中的核心算法,文章针对ID3算法倾向于取值较多的属性的缺点,引进用户兴趣度对ID3算法作了改进,并通过实验对改进前后的算法进行了比较,实验表明,改进后的算法是有效的。  相似文献   

9.
基于属性重要度的ID3改进算法   总被引:8,自引:0,他引:8  
ID3算法是数据挖掘中最经典的分类算法.该算法偏向于选择取值较多的属性,而属性值较多的属性不总是重要的,从而影响了分类预测的高效性.通过对ID3算法的研究,依据属性重要度粗糙集理论的思想,对经典的ID3算法做了相应的改进,改进后的ID3算法(AIID3),提高了算法的决策效率.最后的实例及应用表明,改进的算法更有效,更快速.  相似文献   

10.
针对传统ID3算法计算过程复杂以及存在信息冗余的问题,提出了一种改进算法——基于粗糙集属性约简的简化ID3算法.该算法利用粗糙集中属性约简的性质删掉了系统中多余的知识,在保证同样的分类能力下使得分类系统更简洁,同时借助了泰勒公式对熵公式进行化简,使得计算更简便,然后把改进的算法用到实例中去,并用相关数据库上的大量数据编...  相似文献   

11.
ID3算法是应用最多的决策树生成算法,针对该算法执行效率不高以及取值偏向性的缺点,提出了一种通过降低求信息熵的计算时间和设置权值的改进算法。理论分析和实验结果表明,改进算法在准确度和执行效率方面都比ID3算法更高。  相似文献   

12.
利用ID3算法创建的模型是一个不规则的多叉树,这棵树可以用来预测某一事物的发展,从而为决策者提供数据支持。为了能够使用计算机根据模型进行决策,需要设计合理的数据结构来存储树中的各个结点,为算法设计提供支持。该文根据训练集的数据样本创建了数据模型,并根据模型的特点和查找要求,探讨了多叉树的存储方法,以保证算法的运行效率。  相似文献   

13.
决策树算法是经典的分类挖掘算法之一,具有广泛的实际应用价值。经典的ID3决策树算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得无能为力。为此,对经典ID3决策树生成算法的可并行性进行了深入分析和研究,利用云计算的MapReduce编程技术,提出并实现面向海量数据的ID3决策树并行分类算法。实验结果表明该算法是有效可行的。  相似文献   

14.
一种基于ID3的前剪枝改进算法   总被引:2,自引:0,他引:2  
ID3算法作为一种流行的决策树算法,因为其算法简单、易实现而被广泛使用。但其生成的树结构往往过于庞大,复杂,也影响了算法效率。为了优化树的结构,提高树生成的效率,避免“过拟合”效应,本文将每个分类属性分类后的效果也考虑在内,即,若分类效果达到某个预定的标准则终止那条分支继续分类,并引入了最大支持度的概念,采用了前剪枝策略,对ID3算法进行了改进。实验结果显示,改进算法的确能够使生成的决策树在保证精度的基础上更加精简。  相似文献   

15.
ID3算法是数据挖掘分类中的一种重要算法,它是以信息增益作为属性选择的标准。针对 ID3算法存在的一些不足,提出一种基于修正参数简化标准的 ID3改进算法:1)在信息熵中引入修正参数;2)对引入修正参系数后的信息熵进行简化。实验数据结果表明,改进后的算法能得到更合理、更有效的规则,不仅在一定程度上克服了取值偏向问题,同时减少计算量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号