首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
决策树学习算法ID3的研究   总被引:28,自引:0,他引:28  
ID3是决策树学习的核心算法,为此详细叙述了决策树表示方法和ID3决策树学习算法,特别说明了决策属性的选取法则。通过一个学习实例给出该算法第一选取决策属性的详细过程,并且对该算法进行了讨论,一般情况下,ID3算法可以找出最优决策树。  相似文献   

2.
决策树ID3算法的改进   总被引:3,自引:0,他引:3  
本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更高的计算速度。  相似文献   

3.
决策树算法是数据挖掘中常用的重要方法,广泛应用于分类和预测。本文对决策树的ID3算法的基本思想进行了介绍,通过应用实例说明了构造决策树的实现过程。  相似文献   

4.
利用ID3算法建立决策树的研究   总被引:1,自引:0,他引:1  
刘春阳 《福建电脑》2008,24(7):99-100
本文主要介绍了决策树的基本思想,详细介绍了ID3算法的原理,并利用ID3算法建立了决策树,生成相应的规则。  相似文献   

5.
罗雨滋  付兴宏 《计算机系统应用》2013,22(10):136-138,187
本文通过数据挖掘对传统ID3决策树分类算法及性能进行分析研究,‘利用高等数学中的微分理论知识,改进和优化了ID3算法中的运算速度和选择测试属性偏向问题,并进一步给出了改进算法的伪代码.  相似文献   

6.
经典ID3决策树算法适用于离散型数据分类,但用于连续处理时需要数据离散化容易导致信息损失。提出邻域等价关系从而诱导邻域ID3(NID3)决策树算法,NID3算法改进了ID3决策树算法,能够直接实施连续预测并获取更好的分类效果。在邻域决策系统中,挖掘一种邻域等价关系;基于邻域等价粒化,构建邻域信息度量;基于邻域信息增益,设计NID3决策树算法。实例分析与数据实验均表明,NID3算法具有连续数据分类预测有效性,在分类机器学习中优于ID3算法。  相似文献   

7.
分类技术是根据数据集的特点找出类别的概念描述,这个概念描述代表了这类数据的整体信息,也就是该类的内涵描述。ID3算法是决策树归纳分类算法的一种,运用该算法建立学生专升本考试成绩分析决策树并从中提取出一些重要的规则。  相似文献   

8.
针对传统ID3算法计算过程复杂以及存在信息冗余的问题,提出了一种改进算法——基于粗糙集属性约简的简化ID3算法.该算法利用粗糙集中属性约简的性质删掉了系统中多余的知识,在保证同样的分类能力下使得分类系统更简洁,同时借助了泰勒公式对熵公式进行化简,使得计算更简便,然后把改进的算法用到实例中去,并用相关数据库上的大量数据编程进行仿真实验,最后得出的仿真结果证明了所提出算法的正确性与可行性,不仅能够有效降低信息重复度,减少了冗余规则,还保证了算法精度,同时为把ID3算法更好地应用到现实生活实例中提供了一定的参考价值.  相似文献   

9.
银行信贷业务是银行的一项重要业务,该业务存在一定的风险,如果我们能够预测客户的违约风险就可以最大程度的降低风险。数据挖掘技术可以很好的解决这一问题。将数据挖掘技术运用到银行客户信用评估,在庞大的数据中将看似无关联的数据进行筛选和净化,提取出有价值的信息,对客户贷款申请做出恰当的回应。数据挖掘是信息技术发展的必然结果,它是指通过挖掘算法从大量数据中抽取挖掘出隐含在其中的有价值的模式或规律等信息的复杂过程。其中,对数据的分类是数据挖掘领域研究的重要课题。本文通过决策树的经典算法ID3算法对银行信贷业务进行分析,并总结了该算法相对于其他算法的优缺点。  相似文献   

10.
王小巍  蒋玉明 《计算机工程与设计》2011,32(9):3069-3072,3076
为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法.它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已知值的相对频率随机分布的思想,可以处理缺少属性值的样本.描述了通过改进的ID3算法生成...  相似文献   

11.
决策树算法是经典的分类挖掘算法之一,具有广泛的实际应用价值。经典的ID3决策树算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得无能为力。为此,对经典ID3决策树生成算法的可并行性进行了深入分析和研究,利用云计算的MapReduce编程技术,提出并实现面向海量数据的ID3决策树并行分类算法。实验结果表明该算法是有效可行的。  相似文献   

12.
《软件》2016,(12):89-92
随着硬件设备的普及,促使信息技术和移动互联网的快速发展,人们已经告别了信息匮乏的时期,而进入到了信息过载的时期。人们试图用搜索功能搜索出自己想要的信息,如今已是非常困难,怎样从海量的数据中筛选出有价值的信息是信息提供者和信息需求者都要面对的挑战。本文对数据分类中的ID3算法的基本概念和原理以及其构造过程进行了详细阐述,针对ID3算法倾向于选择取值较多的属性的缺点,引进属性阈值和信息增益率两个概念。弥补ID3算法属性选择标准的不足,来实现新的属性选择标准,对原有ID3算法进行改进。通过实验对改进前后的算法进行了比较,实验表明,改进后的算法提高了分类准确度。  相似文献   

13.
基于朴素贝叶斯与ID3算法的决策树分类   总被引:2,自引:0,他引:2       下载免费PDF全文
v在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID3算法的多值偏向问题,并且具有较高的执行效率和分类准确度。  相似文献   

14.
本文讨论了基于互信息的决策树分类算法——ID3算法及其改进算法C4.5。  相似文献   

15.
阐明决策树分类器在用于分类的数据挖掘技术中依然重要,论述基于决策树归纳分类的ID3、C4.5算法,并且对决策属性的选取法则进行说明。通过实例解析ID3、C4.5算法实现过程,结果表明C4.5算法相比较于ID3算法的优越性.尤其在处理具有多属性值的数据时的更加合理和正确。  相似文献   

16.
多关系决策树学习算法的研究与改进   总被引:1,自引:0,他引:1  
通过对多关系决策树学习算法MRDTL-2进行研究与分析,针对其运行效率较低和不能有效处理丢失属性值的问题,提出一种改进的多关系数据挖掘(IMRDTL)算法。在IMRDTL算法中,利用元组ID传播技术来进一步提高MRDTL-2算法的运行效率,同时使用广义朴素贝叶斯分类器来填补丢失的属性值,以进一步提高算法的准确率。  相似文献   

17.
木马是目前计算机网络面临的主要安全威胁之一.针对现有木马检测方法的不足,提出了行为分析与ID3决策树相结合的木马动态检测技术,对其原理、算法、实现和性能进行了详细介绍.利用ID3算法对样本进行学习建立的木马判定决策树,根据程序运行时的行为判定其是否为木马.在Windows系统下的实现和测试显示该技术具有较高的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号