共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的度量直接影响决策树分类的效果。基于粗糙集的属性频率函数方法度量属性重要性,并用于分枝划分属性的选择和决策树的预剪枝,提出一种决策树学习算法。同时,为了能处理数值型属性,利用数据集的统计性质为启发式知识,提出了一种改进的数值型属性信息熵离散化算法。实验结果表明,新的离散化方法计算效率有明显提高,新的决策树算法与基于信息熵的决策树算法相比较,结构简单,且能有效提高分类效果。 相似文献
3.
4.
一种基于混合决策树的调度知识获取算法* 总被引:1,自引:1,他引:0
提出了一种基于混合决策树的调度知识获取算法。将模拟退火算法融入遗传算法中,作为一种具有自适应变概率的变异操作,构成一种混合优化方法。利用这种混合方法求解在不同调度目标下制造系统的最优特征子集,同时确定控制决策树规模的最优参数;使用决策树评价混合方法中染色体编码的适应度,在得到不同调度目标下的最优特征子集和最优决策树参数后,生成调度知识。仿真实验结果表明,该算法在性能上优于其他算法。 相似文献
5.
6.
决策树算法的研究及优化 总被引:16,自引:3,他引:16
决策树算法是数据挖掘中的一个比较活跃的研究领域,是对分类问题进行深入分析的一种方法,但构造最优决策树是一个NP困难问题。文中首先介绍了ID3算法的基本思想,然后讨论了决策树算法中的难点问题,针对ID3算法中所存在的不足,提出了一种利用优化法的思想来改进信息增益的算法,并且与ID3算法进行了实验对比。通过实验表明,这种方法从树的规模和分类精度都优于许多决策树算法,使决策效率明显提高。 相似文献
7.
8.
基于Rough Set的最简决策树确定算法的研究 总被引:6,自引:2,他引:6
朱红 《计算机工程与应用》2003,39(13):129-131
决策树是一种有效用于分类的数据采掘方法,有确定性和非确定性决策树。传统的方法是通过信息熵的计算去生成决策树,计算量大。目前有人用RS方法去计算信息熵,但存在局限性。该文将指出其局限性,并给出了一种有效的属性选择算法,确定了最简确定性和非确定性决策树的判别准则及其通用生成算法。 相似文献
9.
10.
决策树算法是数据挖掘中的一个比较活跃的研究领域,是对分类问题进行深入分析的一种方法,但构造最优决策树是一个NP困难问题.文中首先介绍了ID3算法的基本思想,然后讨论了决策树算法中的难点问题,针对ID3算法中所存在的不足,提出了一种利用优化法的思想来改进信息增益的算法,并且与ID3算法进行了实验对比.通过实验表明,这种方法从树的规模和分类精度都优于许多决策树算法,使决策效率明显提高. 相似文献
11.
目前关于决策树剪枝优化方面的研究主要集中于预剪枝和后剪枝算法。然而,这些剪枝算法通常作用于传统的决策树分类算法,在代价敏感学习与剪枝优化算法相结合方面还没有较好的研究成果。基于经济学中的效益成本分析理论,提出代价收益矩阵及单位代价收益等相关概念,采用单位代价收益最大化原则对决策树叶节点的类标号进行分配,并通过与预剪枝策略相结合,设计一种新型的决策树剪枝算法。通过对生成的决策树进行单位代价收益剪枝,使其具有代价敏感性,能够很好地解决实际问题。实验结果表明,该算法能生成较小规模的决策树,且与REP、EBP算法相比具有较好的分类效果。 相似文献
12.
决策树算法及其核心技术 总被引:1,自引:0,他引:1
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。概述了决策树分类算法,指出了决策树算法的核心技术:测试属性的选择和树枝修剪技术。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较,总结出了各种算法的特性,为使用者选择算法或研究者改进算法提供了依据。最后,通过一个实例说明决策树分类在实际生产中的应用。 相似文献
13.
黄炜 《数字社区&智能家居》2011,(9)
决策树是归纳学习和数据挖掘的重要方法,该文对c4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于信息检索结果分类中,实现了检索结果的分层分类处理。 相似文献
14.
纪洪生 《数字社区&智能家居》2006,(32)
以alpha-beta剪枝算法为研究对象,提出一种基于alpha-beta剪枝和概率剪枝因素相结合的概率剪枝算法,来解决博弈树搜索问题。利用概率剪枝算法,可减少博弈树搜索深度,从而加快搜索进程。 相似文献
15.
纪洪生 《数字社区&智能家居》2006,(11):99-100
以alpha—beta剪枝算法为研究对象,提出一种基于alpha—beta剪枝和概率剪枝因素相结合的概率剪枝算法.来解决博弈树搜索问题。利用概率剪枝算法,可减少博弈树搜索深度,从而加快搜索进程。 相似文献
16.
17.
18.
噪音数据是影响决策树训练效率和结果集质量的重要因素。目前的树剪枝方法不能消除噪音数据对选择决策树测试节点属性的影响。为改变这种状况,基于变精度Rough集(VPRS)模型,提出了一个在决策树算法中处理噪音数据的新方法---预剪枝法,该方法在进行选择属性的计算之前基于变精度正区域求取属性修正的分类模式,来消除噪音数据的对选择属性以及生成叶节点的影响。利用该方法对基本ID3决策树算法进行了改进。分析和实验表明,与先剪枝方法相比,该方法能进一步减小决策树的规模和训练时间。 相似文献
19.
Classification is an important data mining task that discovers hidden knowledge from the labeled datasets. Most approaches
to pruning assume that all dataset are equally uniform and equally important, so they apply equal pruning to all the datasets.
However, in real-world classification problems, all the datasets are not equal and considering equal pruning rate during pruning
tends to generate a decision tree with large size and high misclassification rate. We approach the problem by first investigating
the properties of each dataset and then deriving data-specific pruning value using expert knowledge which is used to design
pruning techniques to prune decision trees close to perfection. An efficient pruning algorithm dubbed EKBP is proposed and is very general as we are free to use any learning algorithm as the base classifier. We have implemented
our proposed solution and experimentally verified its effectiveness with forty real world benchmark dataset from UCI machine
learning repository. In all these experiments, the proposed approach shows it can dramatically reduce the tree size while
enhancing or retaining the level of accuracy. 相似文献
20.
基于数据挖掘的决策树方法分析 总被引:1,自引:0,他引:1
决策树方法因其简单、直观、准确率高等特点在数据挖掘及数据分析中得到了广泛的应用。在介绍了决策树方法的一般知识后,深入分析了决策树的生成算法与模型,并对决策树的剪枝过程进行了探讨。 相似文献