首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
将C4.5决策树分类算法用于高职就业预测,并提取挖掘规则。对学生基本信息、各科考试成绩,以及就业信息进行处理,选取决策属性,构造决策树,由提取的规则,获得就业和学生成绩之间的关系,挖掘结果显示,该算法能将学习成绩属性和是否是学生干部属性进行正确分类,做出一定的就业预测,对辅助决策具有一定的帮助。  相似文献   

2.
决策树C4.5算法在数据挖掘中的分析及其应用   总被引:5,自引:0,他引:5  
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。分类器是数据挖掘的一种基本方法。本文对分类器的基本概念、C4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于篮球比赛的技术统计分析中,通过对这些数据分析从而得到一些较实用的预测胜负规则。  相似文献   

3.
决策树技术是数据挖掘的重要方法,广泛应用于客户分类和预测。本文对决策树的C4.5算法的基本思想和特点进行了介绍,并结合实例说明了构造决策树的具体实现过程。  相似文献   

4.
大数据时代已经到来,对数据的处理越来越受到关注,人们迫切需要海量数据背后的重要信息和知识,发现数据中潜在的联系并且发现可以有效运用的方式,取得对获取知识有用的信息,然后根据当前的信息对今后的发展趋势进行预测。目前最常用的评价方式就是运用C4.5算法,将日常的数据有效汇总,然后对客户的相关数据分析比对,根据客户之间不同的特征进行不同的改善方式,达到了提升满意度的效果。  相似文献   

5.
本文详细论述了C4.5算法的原理及计算过程,并运用C4.5算法对某高校2011级电子信息工程专业的学生成绩数据进行分析。首先确定数据挖掘对象,进行样本采集,选择影响成绩的重要属性;然后运用C4.5算法对成绩数据进行分析挖掘从而生成决策树,为今后的教学工作提供指导,以此提高学生的成绩。  相似文献   

6.
上报可疑交易报告是保险公司日常工作之一,目前对可疑交易的识别基本上是工作人员依照中国人民银行公布的《金融机构大额交易和可疑交易报告管理办法》对交易逐条进行识别。本文利用经典的决策树C4.5算法对交易进行分析,自动识别出部分可疑交易。  相似文献   

7.
稳定客户和吸引客户是移动通信企业提高竞争力的关键.基于大量实验数据将数据挖掘的决策树方法引入移动通信行业客户流失分析中,通过对数据的预处理,利用C4.5算法创建决策树,通过测试流失的与未流失的客户,平均正确识别率为91.6%.决策树体现的规则与经验基本一致,为移动通信企业建立客户流失的预警机制提供了决策支持.  相似文献   

8.
C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运行效率.  相似文献   

9.
李一平  姚宏亮 《微型电脑应用》2011,27(6):51-53,57,3
对如何将数据挖掘技术应用于成绩分析的问题进行了研究。通过调查淮北职业技术学院08级学生学习《数据结构》的学习情况,与现有的成绩分析方法完全不同的角度,通过采用数据挖掘中的C4.5算法,建立了学生成绩分析决策树模型,并提取了分类规则,可以对今后的教学工作发挥积极的指导作用,实验结果及分析表明了该方法的有效性。  相似文献   

10.
C4.5算法在国防生素质分析中的应用   总被引:1,自引:0,他引:1  
国防生素质直接影响到依托培养的质量,目前选培办对国防生素质的分析是粗略的或根据经验来判断.本文主要讨论利用数据挖掘中面向属性的归纳和决策树C4.5算法对国防生基本信息进行分析,从中找出影响国防生素质高低的一些规则和模式,帮助选培办针对性地进行教育管理,同时也给国防生选拔工作提供参考依据.  相似文献   

11.
列车轨道故障检测的实现需要对大量的数据进行分析来判定检测结果,决策树是进行数据挖掘与分类分析的常用工具。文中主要讨论如何应用C4.5算法构造列车轨道故障检测的决策树以及根据生成的决策树实现轨道故障的判决。  相似文献   

12.
局域网传输的数据报中携带大量与数据包相关的信息,这些信息在一定意义上反映了数据报的行为。对数据报行为进行分类可为局域网上的网络入侵检测提供重要依据。文中提出使用C4.5决策树分类算法对局域网数据报进行行为分类,并与以往常用的几种分类算法进行了比较。实验表明,C4.5算法对于该问题无论在分类效率还是在分类正确性方面均有很大的优势。  相似文献   

13.
决策树分类算法C4.5是数据挖掘中最常用、最经典的分类算法。但是C4.5算法也存在一些不足之处,针对C4.5算法处理连续属性比较耗时的特点,本文对连续的处理过程进行改进,以提高算法的计算效率。改进的C4.5算法与原C4.5算法相比,在构造决策树时具有相同的准确率和更高的计算速度。  相似文献   

14.
C4.5算法在选择分裂属性时只考虑了每个条件属性和决策属性之间的关系,而没有考虑到条件属性间的相关性,直接影响构建树的准确率。提出一种基于Kendall和谐系数的C4.5决策树优化算法,用于解决条件属性之间相关性的问题,提高算法属性选择的准确性。在引入系数的基础上运用等价无穷小原理对计算公式进行简化,提高了算法的效率。对改进后的C4.5算法和传统的算法进行仿真实验,结果表明,改进的C4.5算法在准确度和效率上都有较大提高。  相似文献   

15.
在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。  相似文献   

16.
WEB文本自动分类在很多方面都有着重要的应用,如信息检索,新闻分类等。决策树算法是一种简单并且广泛使用的分类方法,具有很多优点如:分类精度高,分类速度快等。主要研究了运用C4.5决策树构建Web页面分类器的基本方法和过程,并提出了一个基于C4.5决策树的Web页面分类器的框架。在此基础上实现了一个运用于网络爬虫的Web页面分类器,实验结果表明该算法是非常有效的。  相似文献   

17.
根据高血压病电子病历、实验室检查报告和医师处方数据,将C4.5决策树算法用于高血压分类规则的提取,挖掘出影响高血压病人血压值的重要因素。针对C4.5算法在属性选择方面的不足,引入相关度概念对算法做出改进,改进后的算法生成更合理和有效的分类规则,为高血压的分析预测提出了一种新的方法。  相似文献   

18.
民机设备系统每天都在产生大量的质量数据信息。随着时间的推移及数据量的积累,传统离散制造业的数据统计分析已经无法对这些庞大的质量数据进行有效地处理分析。为了解决这一问题,并挖掘出数据之间的隐含规律,提出了一种有效的数据挖掘方法。该方法通过集成决策树C4.5并行算法完成质量数据分析。分析结果展示了该分析方法的正确性、有效性和价值性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号