首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
C4.5算法是进行数据分类分析的经典决策树数据挖掘算法.本文介绍了决策树及其常用算法,并根据1971-2000年全国气象站点记录的数据信息,采用C4.5决策树算法建立全国积雪模型.通过积雪模型预测区域积雪分布情况的实验表明正确率达到83.96%,可以用于辅助遥感图像雪区检测进行判断决策.  相似文献   

2.
多层次压缩算法克服了C4.5算法在构造树的过程中,需要对数据多次扫描和排序的缺点,并且克服了CART算法存在的没有对数据集分类的缺点,并结合它们的优点从树的规模和分类精度上都做了优化,使决策效率明显提高。利用决策的分类来建立多层次决策树,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。  相似文献   

3.
为了提高数据挖掘准确性和效率,文中提出了基于决策树算法的信息系统数据挖掘方法。以C4.5决策树算法计算属性的信息增益率和属性值的信息熵为基础,提出基于余弦相似度改进的C4.5决策树算法,若任意两个属性值的信息熵之差在阈值范围内,通过计算其余弦相似度合并在阈值范围内的属性值,并重新计算合并后属性的信息增益率,实现信息系统数据挖掘。实验结果显示:所提方法对不同数据集的分类精度均高于95%,数据挖掘效率高。  相似文献   

4.
刘东涛 《现代导航》2022,13(5):334-338
提出了一种基于改进决策树的导航系统故障诊断方法。该方法首先将导航数据的初始属性按照信息增益率进行排序,然后利用神经网络对初始属性进行裁剪处理,最后用裁剪后的属性建立最小决策树,并建立分类规则。与传统的决策树分类算法相比,此方法通过利用信息增益筛选属性,直接生成最小规模决策树,避免了决策树的剪枝处理过程。实验表明,此方法与传统决策树算法相比,时间开销更小,诊断精度也有所提高。  相似文献   

5.
C4.5决策树改进算法研究   总被引:2,自引:0,他引:2  
决策树是数据挖掘分类算法中非常重要的一个算法分支。文章介绍了决策树算法中应用最广泛的典型算法-ID3和C4.5算法,并基于四个通用的数据集,针对这两个算法进行定量分析对比,研究两个算法的性能优劣。文章对C4.5算法中的连续属性离散化方法提出一些优化改进,并通过实际数据实验证实了优化的可行性。  相似文献   

6.
《现代电子技术》2017,(9):93-95
随着信息技术的发展,对等网络P2P信息流量经常出现偏离正常范围的异常情况,这里以决策树算法为基础,对P2P流量检测和流量异常时的检测技术进行研究。采用改进的C4.5决策树P2P流量检测模型,通过P2P流量异常检测模型对大量训练数据集的训练,实现了对错误的逐步修正,通过试验室仿真试验可知,经过选择网络流量特征后,基于改进的C4.5决策树的P2P网络流量分类器能实现较好的分类效果,分类检测率在94.6%~96.7%,较高的检测率说明采用改进的C4.5决策树算法能有效地对P2P流量进行检测,为研究P2P流量异常检测技术提供了参考。  相似文献   

7.
针对电信企业客户流失问题,提出一种基于Weka平台知识自动获取的客户流失预测模型。针对决策树算法偏向于选择取值较多的属性作为测试属性的缺点,结合OIR算法选择相关属性子集进行分类,降低相关度较小属性与重复属性对分类的影响。通过在Weka平台上使用6个UCI数据集和移动公司客户数据的实验结果表明,优化后的决策树算法克服了决策树算法的取值偏置问题,从而获得比J48算法更高分类准确率。  相似文献   

8.
基于模糊模式与决策树融合的脚本病毒检测算法   总被引:2,自引:0,他引:2  
构建决策树进行脚本病毒检测可以全面利用训练样本的信息,在样本特征较为复杂、样本数较大的情况下会产生大量节点,计算时间复杂度高,在剪枝过程中影响分类准确度。为融合模糊模式的信息以提高分类器性能,该文设计了决策树分类基础上的融合算法。该算法将关于模糊模式贴近度的3个特性作为决策树样本信息向量中的属性。使用训练样本集,根据上述属性在划分点上的分裂信息值及信息增益率选择分裂属性,逐步构建决策树。实验结果验证了算法的稳定性与准确度,表明这种融合方法可增加属性的区分度,减少决策树的分支数。  相似文献   

9.
孟杨  候飞飞 《通讯世界》2016,(10):131-132
随着教育信息化的发展,在教学中产生了大量的数据,利用决策树算法通过建立预测模型,发现学生掌握知识点之间的相互联系,进而为老师制订教学计划提供依据,提高学生学习效果.本文采用改进后C4.5算法及分析节点之间的关联规则,通过根据学生对不同知识点试题的答题情况的数据,构建决策树进行分类,运用关联规则分析知识点节点之间有用的强规则.  相似文献   

10.
王荣 《信息技术》2012,(5):94-96
利用决策树分类算法对课程信息、教师信息、成绩信息等教学信息库中的数据进行分析,从而生成决策树并从决策树中挖掘出影响成绩高低的主要因素以及各因素对成绩影响的强弱程度。将数据挖掘技术应用到数据的多维分析中,可以更好地为教学管理人员提供决策支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号