共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
多层次压缩算法克服了C4.5算法在构造树的过程中,需要对数据多次扫描和排序的缺点,并且克服了CART算法存在的没有对数据集分类的缺点,并结合它们的优点从树的规模和分类精度上都做了优化,使决策效率明显提高。利用决策的分类来建立多层次决策树,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。 相似文献
3.
为了提高数据挖掘准确性和效率,文中提出了基于决策树算法的信息系统数据挖掘方法。以C4.5决策树算法计算属性的信息增益率和属性值的信息熵为基础,提出基于余弦相似度改进的C4.5决策树算法,若任意两个属性值的信息熵之差在阈值范围内,通过计算其余弦相似度合并在阈值范围内的属性值,并重新计算合并后属性的信息增益率,实现信息系统数据挖掘。实验结果显示:所提方法对不同数据集的分类精度均高于95%,数据挖掘效率高。 相似文献
4.
提出了一种基于改进决策树的导航系统故障诊断方法。该方法首先将导航数据的初始属性按照信息增益率进行排序,然后利用神经网络对初始属性进行裁剪处理,最后用裁剪后的属性建立最小决策树,并建立分类规则。与传统的决策树分类算法相比,此方法通过利用信息增益筛选属性,直接生成最小规模决策树,避免了决策树的剪枝处理过程。实验表明,此方法与传统决策树算法相比,时间开销更小,诊断精度也有所提高。 相似文献
5.
C4.5决策树改进算法研究 总被引:2,自引:0,他引:2
决策树是数据挖掘分类算法中非常重要的一个算法分支。文章介绍了决策树算法中应用最广泛的典型算法-ID3和C4.5算法,并基于四个通用的数据集,针对这两个算法进行定量分析对比,研究两个算法的性能优劣。文章对C4.5算法中的连续属性离散化方法提出一些优化改进,并通过实际数据实验证实了优化的可行性。 相似文献
6.
7.
8.
基于模糊模式与决策树融合的脚本病毒检测算法 总被引:2,自引:0,他引:2
构建决策树进行脚本病毒检测可以全面利用训练样本的信息,在样本特征较为复杂、样本数较大的情况下会产生大量节点,计算时间复杂度高,在剪枝过程中影响分类准确度。为融合模糊模式的信息以提高分类器性能,该文设计了决策树分类基础上的融合算法。该算法将关于模糊模式贴近度的3个特性作为决策树样本信息向量中的属性。使用训练样本集,根据上述属性在划分点上的分裂信息值及信息增益率选择分裂属性,逐步构建决策树。实验结果验证了算法的稳定性与准确度,表明这种融合方法可增加属性的区分度,减少决策树的分支数。 相似文献
9.
随着教育信息化的发展,在教学中产生了大量的数据,利用决策树算法通过建立预测模型,发现学生掌握知识点之间的相互联系,进而为老师制订教学计划提供依据,提高学生学习效果.本文采用改进后C4.5算法及分析节点之间的关联规则,通过根据学生对不同知识点试题的答题情况的数据,构建决策树进行分类,运用关联规则分析知识点节点之间有用的强规则. 相似文献
10.
利用决策树分类算法对课程信息、教师信息、成绩信息等教学信息库中的数据进行分析,从而生成决策树并从决策树中挖掘出影响成绩高低的主要因素以及各因素对成绩影响的强弱程度。将数据挖掘技术应用到数据的多维分析中,可以更好地为教学管理人员提供决策支持。 相似文献