共查询到19条相似文献,搜索用时 78 毫秒
1.
杜丽英 《计算机光盘软件与应用》2014,(23):134-134
决策树技术是数据挖掘的重要方法,广泛应用于客户分类和预测。本文对决策树的C4.5算法的基本思想和特点进行了介绍,并结合实例说明了构造决策树的具体实现过程。 相似文献
2.
数据挖掘是从大量数据中提取有用信息的新技术。本文介绍了数据挖掘的基本概念,重点分析了决策树C5算法。并使用SPSS公司Clementine工具提供的C5算法,实现意向购房的数据挖掘。 相似文献
3.
针对智能电表故障状态的预测问题,提出了一种基于Apriori算法和C5.0算法建立智能电表故障识别模型,实现智能电表故障的预测。首先,对智能电表历史故障数据库进行数据挖掘预处理,并采用Apriori算法进行强关联因素深度挖掘。然后,将强关联因素组成的数据集合分为训练数据集和测试数据集两部分,采用C5.0算法对训练数据集进行数据挖掘,生成智能电表故障初步预测规则。接着,根据测试集的数据对初步预测规则的正确性进行评估:如果准确度满足要求,确定预测规则;如果不满足,则返回训练集。最后,根据获得的预测规则建立智能电表故障状态预测模型进行智能电表故障预测。算例分析结果证明,智能电表故障状态预测模型具有较高的精度,可获得极为准确的故障状态预测结果。 相似文献
4.
5.
数据挖掘是从大量数据中提取有用信息的新技术。本文介绍了数据挖掘的基本概念,重点分析了决策树C5算法。并使用SPSS公司Clementine工具提供的C5算法,实现意向购房的数据挖掘。 相似文献
6.
7.
稳定客户和吸引客户是移动通信企业提高竞争力的关键.基于大量实验数据将数据挖掘的决策树方法引入移动通信行业客户流失分析中,通过对数据的预处理,利用C4.5算法创建决策树,通过测试流失的与未流失的客户,平均正确识别率为91.6%.决策树体现的规则与经验基本一致,为移动通信企业建立客户流失的预警机制提供了决策支持. 相似文献
8.
决策树算法是一种非参数化、非线性的监督分类法。以2010年8月1日Landsat TM影像为基础遥感信息源,以内蒙古自治区赤峰市中部巴林右旗、林西县、克什克腾旗、翁牛特旗交汇处的区域为研究区,通过多次修改完善训练样本数据集,然后把6个原始波段和NDVI、主成分分析后的前3个主分量、常用8个纹理特征以及3个地形特征等共21个特征变量组合成5个不同特征变量组合,采用典型决策树算法C5.0进行了遥感影像分类实验,与最大似然分类结果进行对比。结果表明:C5.0决策树的分类结果优于最大似然结果,尤其是特征变量组合恰当的时候,能够有效利用相关辅助信息,因而最终的分类结果更能满足用户需求。 相似文献
9.
本文针对高校奖学金评定中存在受学校、专业等因素影响的问题,以湖南农业大学为例,通过对大学生综合测评信息有关属性的数据分析,建立了奖学金评价体系数据集,并采用C4.5算法,构建了奖学金评价体系决策树。 相似文献
10.
使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,提出了一种基于ROSE(Random Over Sampling Examples)和C5.0算法的初筛模型。利用收集到的人体测量学指标数据,通过数据预处理,删除异常值并填补缺失值。然后采用ROSE算法对数据进行平衡,利用C5.0分类器对平衡后的数据构建筛查模型,通过十则交叉验证的方法检验模型的筛查效果。实验结果表明,使用该模型进行打鼾患者的OSAHS筛查,可以有效地提高筛查效率。 相似文献
11.
一种新的基于遗传算法的数据分类方法 总被引:5,自引:0,他引:5
当前分类算法还存在诸如伸缩性不强、可调性差、缺乏全局优化能力等问题.通过构造完全分类规则集,设计了一种有效的遗传编码方法,使得遗传算法的各种优良特性在数据分类中得到充分的运用,从而提出了一种新的数据分类算法,新算法有效提高了数据分类的准确性,较好克服了当前存在的缺点.最后,给出了实验结果,证实了算法的有效性. 相似文献
12.
本文利用数据挖掘中C5.0决策树模型判别分析法建立陶瓷原料分类模型,探讨陶瓷原料的分类方法,研究结果表明:经该模型计算所得的分类结果和实际情况相吻合。该方法有助于在配方过程中遴选陶瓷原料,可在生产过程中应用和推广。 相似文献
13.
14.
基于数据挖掘技术的证券客户分析系统 总被引:2,自引:0,他引:2
基于数据挖掘技术研究并实现了证券客户分析系统,通过对数据进行详细的分析和预处理,通过数据挖掘工具SPSS CLEMENTINE8.0中的K-平均值、C5.0算法建立模型,并运用模型预测最有潜力的客户,实际应用验证了其准确性. 相似文献
15.
局域网传输的数据报中携带大量与数据包相关的信息,这些信息在一定意义上反映了数据报的行为。对数据报行为进行分类可为局域网上的网络入侵检测提供重要依据。文中提出使用C4.5决策树分类算法对局域网数据报进行行为分类,并与以往常用的几种分类算法进行了比较。实验表明,C4.5算法对于该问题无论在分类效率还是在分类正确性方面均有很大的优势。 相似文献
16.
决策树分类算法C4.5是数据挖掘中最常用、最经典的分类算法。但是C4.5算法也存在一些不足之处,针对C4.5算法处理连续属性比较耗时的特点,本文对连续的处理过程进行改进,以提高算法的计算效率。改进的C4.5算法与原C4.5算法相比,在构造决策树时具有相同的准确率和更高的计算速度。 相似文献
17.
18.
19.
吴梨梨 《网络安全技术与应用》2014,(9):162-163
高职教育为社会培养高素质的技能型人才发挥了重要作用,但是有部分高职学生在就业中并没有从事跟本专业相关的职业.造成这种结果的一个原因就是学生的专业选择.利用数据挖掘技术对专业倾向性进行分析,找出影响专业学习的因素,帮助学生进行专业的选择,同时也使得高职院校在专业的课程设置中更有针对性. 相似文献