共查询到20条相似文献,搜索用时 0 毫秒
1.
ID3算法的一种改进算法 总被引:33,自引:5,他引:33
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。ID3算法是决策树中的核心算法,文章针对ID3算法倾向于取值较多的属性的缺点,引进用户兴趣度对ID3算法作了改进,并通过实验对改进前后的算法进行了比较,实验表明,改进后的算法是有效的。 相似文献
2.
3.
4.
本文通过数据挖掘对传统ID3决策树分类算法及性能进行分析研究,‘利用高等数学中的微分理论知识,改进和优化了ID3算法中的运算速度和选择测试属性偏向问题,并进一步给出了改进算法的伪代码. 相似文献
5.
ID3算法是最基本的决策树学习算法,有广泛的应用。基于ID3算法的层间不相关性与生成树中相邻层的耦合性,该文提出了一种改进的ID3的决策树算法(E-ID3)。算法采用统计局部最优的方法,能获得比较好的启发式函数。实验证明,这种方法从树的规模和分类精度都优于ID3算法,决策效率明显提高。 相似文献
6.
决策树ID3算法的改进 总被引:3,自引:0,他引:3
本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更高的计算速度。 相似文献
7.
决策树算法是数据挖掘中常用的重要方法,广泛应用于分类和预测。本文对决策树的ID3算法的基本思想进行了介绍,通过应用实例说明了构造决策树的实现过程。 相似文献
8.
基于属性值的ID3算法改进 总被引:5,自引:1,他引:5
ID3算法是数据挖掘中经典的决策树分类算法.针对ID3算法所存在的属性取值偏向问题及只时较小的数据集有效的缺点提出改进.当训练样本各属性的取值个数相差较大的情况下,在计算划分标准时引入了属性取值个数N,在一定程度上克服了ID3算法易偏向于取值较多的属性这一缺陷,得到了结构更简洁的、较为理想的决策树.采用先剪枝的方法实现改进,设定一个阈值避免决策树的完全生长,在保持分类准确率的同时,大大地提高了算法的速度.实验结果表明,改进后的算法(AVID3)对许多数据集比传统ID3算法更有效. 相似文献
9.
ID3算法是数据挖掘中经典的决策树分类算法,该算法具有抗噪声能力差的缺点。通过对ID3算法的研究,依据可变精度粗糙集理论的思想,采用在计算属性信息熵时设定阈值的方法,以放宽属性选择的要求,从而对经典的ID3算法做了相应的改进。改进后的ID3算法(VPID3)可在一定程度上降低噪声对系统分类的干扰,使分类结果更加符合实际要求。最后通过举例,说明了改进算法的可行性。 相似文献
10.
ID3算法是应用最多的决策树生成算法,针对该算法执行效率不高以及取值偏向性的缺点,提出了一种通过降低求信息熵的计算时间和设置权值的改进算法。理论分析和实验结果表明,改进算法在准确度和执行效率方面都比ID3算法更高。 相似文献
11.
客户是企业的重要资产,是企业赖以生存和发展的基础.客户细分是CRM和精准营销的基础,是企业关注的热点和焦点.本文在数据调研的基础上,使用ID3算法定量计算训练集样本中属性的信息并建立相应的决策树,从而实现对客户群体的正确分类与评价. 相似文献
12.
为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法.它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已知值的相对频率随机分布的思想,可以处理缺少属性值的样本.描述了通过改进的ID3算法生成... 相似文献
13.
14.
ID3算法是决策树中影响最大的算法之一,它以信息增益为标准选择决策树的测试属性。这种算法存在不足之处,在选择合适的测试属性时,倾向于选择取值较多的属性,而在实际应用中,取值较多的属性未必是重要的。针对此算法的不足,本文提出了一种对增益修正的 ID3算法,为改善 ID3的多值偏向问题提供了一种有效途径。通过理论分析和实验证明,这种算法能较好地解决多值倾向的问题。 相似文献
15.
针对机械制造业中质量管理不规范、决策效率偏低问题,以典型的机械制造企业为切入点,运用ID3决策树算法,以数据挖掘跨行业标准过程(CRISP-DM)对其质量管理信息进行数据挖掘。利用基于信息增益率的计算分类技术,生成了决策树模型,并将该模型在企业资源计划(ERP)中进行了初步实现。通过测试分析,该模型能有效提高管理决策效率,规范处理流程。 相似文献
16.
基于属性重要度的ID3改进算法 总被引:8,自引:0,他引:8
ID3算法是数据挖掘中最经典的分类算法.该算法偏向于选择取值较多的属性,而属性值较多的属性不总是重要的,从而影响了分类预测的高效性.通过对ID3算法的研究,依据属性重要度粗糙集理论的思想,对经典的ID3算法做了相应的改进,改进后的ID3算法(AIID3),提高了算法的决策效率.最后的实例及应用表明,改进的算法更有效,更快速. 相似文献
17.
基于改进ID3算法的轨迹化决策研究 总被引:4,自引:2,他引:4
初步对决策树算法在钻井工程中水平井方面的应用进行了研讨。在水平井钻井工程中,轨迹优化设计的重要性不言而喻,它对整个的施工过程都具有重要的指导意义。在工程实践中,主要是依据设计人员的经验来确定造斜点位置,从而确定整个优化轨迹。这个过程中,设计人员的经验决策起了主要的作用,这就为应用决策树学习算法来学习设计人员的决策经验提供了可行性。基于此思路,应用改进了的ID3算法,进行了初步实现。 相似文献
18.
随着部队实战化训练的深入,传统的训练成绩分析方法已不能适应科学组训的需要。该文引入射击训练实例,应用人工智能中机器学习的ID3归纳学习算法,对射击情况进行分类分析,得出影响军事训练成绩的内部原因以及其他一些结论。 相似文献
19.
王昆 《计算机光盘软件与应用》2012,(13):59+61
银行信贷业务是银行的一项重要业务,该业务存在一定的风险,如果我们能够预测客户的违约风险就可以最大程度的降低风险。数据挖掘技术可以很好的解决这一问题。将数据挖掘技术运用到银行客户信用评估,在庞大的数据中将看似无关联的数据进行筛选和净化,提取出有价值的信息,对客户贷款申请做出恰当的回应。数据挖掘是信息技术发展的必然结果,它是指通过挖掘算法从大量数据中抽取挖掘出隐含在其中的有价值的模式或规律等信息的复杂过程。其中,对数据的分类是数据挖掘领域研究的重要课题。本文通过决策树的经典算法ID3算法对银行信贷业务进行分析,并总结了该算法相对于其他算法的优缺点。 相似文献