首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
C4.5决策树改进算法研究   总被引:2,自引:0,他引:2  
决策树是数据挖掘分类算法中非常重要的一个算法分支。文章介绍了决策树算法中应用最广泛的典型算法-ID3和C4.5算法,并基于四个通用的数据集,针对这两个算法进行定量分析对比,研究两个算法的性能优劣。文章对C4.5算法中的连续属性离散化方法提出一些优化改进,并通过实际数据实验证实了优化的可行性。  相似文献   

2.
《现代电子技术》2017,(9):93-95
随着信息技术的发展,对等网络P2P信息流量经常出现偏离正常范围的异常情况,这里以决策树算法为基础,对P2P流量检测和流量异常时的检测技术进行研究。采用改进的C4.5决策树P2P流量检测模型,通过P2P流量异常检测模型对大量训练数据集的训练,实现了对错误的逐步修正,通过试验室仿真试验可知,经过选择网络流量特征后,基于改进的C4.5决策树的P2P网络流量分类器能实现较好的分类效果,分类检测率在94.6%~96.7%,较高的检测率说明采用改进的C4.5决策树算法能有效地对P2P流量进行检测,为研究P2P流量异常检测技术提供了参考。  相似文献   

3.
C4.5算法在高校教师评价中的应用研究   总被引:2,自引:0,他引:2  
吴陈  林炎钟 《信息技术》2011,35(1):133-136
C4.5算法是从经典算法ID3中改进得来,算法的最初来源是信息熵,从中确定属性和类别之间相关性和确定性。通过对信息熵的解释,深刻说明和分析C4.5算法。并提出把C4.5算法应用于高校教师评价上,构造出决策树,从而进一步提高和完善了对高校教师评价的准确性。  相似文献   

4.
针对海量数据中存在的造假与欺诈问题,文中提出了一种基于数据挖掘与改进决策树的数据分析算法来识别其中的异常数据。该算法将主成分分析法与改进决策树算法C4.5相结合,利用数据挖掘技术对海量数据进行预处理,并提取重要特征,通过加入信息增益率的改进决策树算法C4.5识别出异常数据。在海量医疗财务数据中进行的实验仿真结果表明,所提算法的准确率达到了96.91%,且其对数据的预处理操作也使算法的识别速度提升了1.25 s。同时还对各种机器学习算法与数据挖掘技术进行了对比,进而证明了该文算法的识别准确率最高,且与SVM算法相比提升了10.8%。  相似文献   

5.
作业车间的历史调度隐含着丰富的调度信息,文章在传统调度规则、数据挖掘、遗传算法相结合的作业车间调度方法的基础上,提出了基于数据挖掘的调度算法。选择与优化目标相关的工序信息作为历史离线调度数据集的属性,提出了一种应用于决策树的属性分类方法,再利用决策树C4.5算法从数据集中获得调度知识,形成C4.5多叉树规则,进一步与启发式算法融合,改进了初始种群随机的局限性,实现作业车间的实时调度优化。仿真表明,文章所提出的算法在优化性能和收敛速度方面具有明显的优势。  相似文献   

6.
由于网络流量表现出突发和自相似等动态特性,使得网络应用很难进行准确分类,通过对网络应用类型进行分类可以对影响网络资源分布的新应用进行归类,在一定程度上规避了新应用识别的局限性.通过使用朴素贝叶斯、支持向量机和C4.5决策树三种监督学习算法从细粒度层上对四种网络流量应用类型进行分类对比,实验表明,使用C4.5决策树算法构...  相似文献   

7.
C4.5算法是进行数据分类分析的经典决策树数据挖掘算法.本文介绍了决策树及其常用算法,并根据1971-2000年全国气象站点记录的数据信息,采用C4.5决策树算法建立全国积雪模型.通过积雪模型预测区域积雪分布情况的实验表明正确率达到83.96%,可以用于辅助遥感图像雪区检测进行判断决策.  相似文献   

8.
C4.5算法作为决策树算法家族中的重要成员,是对ID3算法的继承与拓展。C4.5算法不仅能处理名词属性而且能处理连续属性,极大提高类C4.5算法的学习能力。文章将C4.5算法应用到棉花诊断中,通过对棉花病害数据学习成树,得到可理解的诊断规则。  相似文献   

9.
李颖 《信息技术》2022,(2):116-120,126
为了提高数据挖掘准确性和效率,文中提出了基于决策树算法的信息系统数据挖掘方法.以C4.5决策树算法计算属性的信息增益率和属性值的信息熵为基础,提出基于余弦相似度改进的C4.5决策树算法,若任意两个属性值的信息熵之差在阈值范围内,通过计算其余弦相似度合并在阈值范围内的属性值,并重新计算合并后属性的信息增益率,实现信息系统...  相似文献   

10.
孟杨  候飞飞 《通讯世界》2016,(10):131-132
随着教育信息化的发展,在教学中产生了大量的数据,利用决策树算法通过建立预测模型,发现学生掌握知识点之间的相互联系,进而为老师制订教学计划提供依据,提高学生学习效果.本文采用改进后C4.5算法及分析节点之间的关联规则,通过根据学生对不同知识点试题的答题情况的数据,构建决策树进行分类,运用关联规则分析知识点节点之间有用的强规则.  相似文献   

11.
魏军  苏晓伟  冯凡 《数字化用户》2022,(13):175-177
大多数高职院校将学生能否通过国家计算机一级(简称NCRE)等级考试作为考核学生能否毕业的一个条件?本文在介绍C4.5算法的相关理论基础上,以某职业技术学院2021年9月份学生考试成绩数据集为基础,对数据集进行预处理,建立分类模型?实验结果表明,将C4.5算法应用到学生NCRE考试成绩中进行分析,能够帮助教师找到影响学生...  相似文献   

12.
消费行为因素分析对产品生产和销售具有重要指导作用。C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,先对消费数据集进行数据预处理,为了利用消费者的消费数据进行消费行为分析,对消费数据形式化表示,形成消费客户交易数据集和交易统计信息表达。然后在消费客户交易数据集上定义了信息增益率,反映消费因素的分类能力。利用C4.5算法对消费者行为进行分析并构造出决策树,挖掘消费数据之间隐藏的潜在关系,对企业的生产经营具有重大的指导意义;运用预剪枝和后剪枝对完全决策树进行剪枝,对比剪枝后效果。  相似文献   

13.
蓝机满 《电子科技》2019,32(8):70-74
为了高效、快速地解决呈指数增长的数据处理问题,提高数据储存、运算能力,文中提出了基于云计算的数据挖掘系统的设计。该系统首先分析了主流云计算平台Spark的组件构成和运行机制,深入研究其计算架构的编程原理。同时利用Spark进行了C4.5算法和K-medoids聚类算法的并行化设计,有效提高算法的运行速度、收敛速度和结果的稳定性。测试表明,在进行海量数据的分析处理时,文中提出的云计算平台在分类误差内,可有效提高整体系统的运算速度,分类效率也大幅提高。  相似文献   

14.
多层次压缩算法克服了C4.5算法在构造树的过程中,需要对数据多次扫描和排序的缺点,并且克服了CART算法存在的没有对数据集分类的缺点,并结合它们的优点从树的规模和分类精度上都做了优化,使决策效率明显提高。利用决策的分类来建立多层次决策树,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。  相似文献   

15.
在遥感图像数据监督分类方法中,普遍存在着通过大训练数据量提高分类精度的问题。该文在笔者已经实现的遗传超平面方法基础上,做了进一步的改进,这就使得这种遗传超平面分类器可以使用了少量的训练数据进行训练,而得到的分类精度与大训练数据量相比具有可以接受的差别;改进了分类方法中使用主成分分析后再用两个主成分进行分类的做法,使用的原始数据为多个(3个以上)波段直接进行分类,不但增加了分类输入的信息量,而且简化了技术流程。同时,在不增加分类时间的情况下扩展了算法分类的类别数。文中使用C/C++从底层实现了整个训练、分类、测试过程,通过对北京的ETM+数据进行的分类实验及其分析表明该算法分类效果很好,完全可以达到实用的要求。  相似文献   

16.
针对随机森林算法、支持向量机以及线性判别分析3种分类方法分类准确率较低、性能不佳的问题,基于机载激光雷达和高光谱技术提出一种新的遥感监测数据分类方法。分析机载激光雷达和高光谱遥感的工作原理,依据二者的工作原理提取遥感监测数据。为了提升数据分类的准确性,需要进行数据预处理,具体包括噪声点剔除和平滑校正处理,并进行数据配准。在此基础上,采用K最近邻搜索算法提取遥感监测数据特征,最终运用决策树算法中的C4.5算法构建分类器,实现遥感监测数据的分类。实验结果表明:通过混淆矩阵得到所设计方法的分类准确性达到了95以上,分类结果优于传统分类方法,能准确识别目标,证明了方法有效性和可行性。  相似文献   

17.
采用附加动量BP算法、自适应最速下降BP算法、自适应动量BP算法、弹性BP算法4种启发式改进方法分别对标准BP算法进行改进,并构建了相应的BP神经网络分类模型,将构建的4种分类模型应用于二维向量模式的分类,并进行了泛化能力测试,将4种BP网络分类模型的分类结果进行对比。仿真结果表明,对于中小规模的网络而言,弹性BP算法改进的BP网络的分类结果最为精确,收敛速度最快,分类性能最优;附加动量BP算法改进的BP网络的分类结果误差最大,收敛速度最慢,分类性能最差;自适应学习速率BP算法改进的BP网络的分类结果的误差值、收敛速度及分类性能介于上述两种算法之间。  相似文献   

18.
传统的诊断方法效率低又耗费人力,具有较大的局限性.本文提出的基于Adaboost的网络设备故障诊断算法是一种机器学习算法,通过选择C4.5决策树弱分类器集成一个强分类器,从而具有效率高,分类效果等特点.通过与神经网络、KNN等方法进行实验结果比较,所提算法效率更优,能更好应用于网络设备的故障诊断.  相似文献   

19.
潘晓英  焦李成  刘芳 《电子学报》2009,37(3):628-633
 受基于文化进化机制的粒度进化计算启发,针对分类任务提出了一种粒度智能体进化分类算法.该方法以粒度智能体表示具有相似属性的数据;以其中包含的知识库来指导粒度智能体的进化;设计了适合分类问题的粒度进化算子——同化算子、交换算子以及分化算子,分别体现了智能体的竞争性、协同性以及自学习性.最终根据一定的策略从所得到的粒度智能体中提取出分类规则,用以对新数据的预测分类.测试结果表明该算法具有良好的分类预测性能,且仅需要较小的训练时间代价.在UCI中的大部分数据集上都要优于性能良好的G-NET,OCEC以及C4.5算法.  相似文献   

20.
模糊C均值聚类(FCM)算法是一种基于非监督聚类算法。样本加权模糊C均值聚类(WFCM)算法是FCM算法的改进,该算法能够明显提高收敛速度和聚类的准确性。无论是FCM算法还是WFCM算法,对噪声都相对敏感,而且聚类数目仍然需要人工确定。在此提出一种改进算法,首先通过偏微分方程(PDE)降噪算法对原始脑MRI医学图像进行处理;其次利用聚类有效性确定最佳聚类数目,对WFCM算法进行改进;最后利用本文改进算法对图像进行聚类分割。实验表明,该方法是一种具有自动分类能力、抗噪性较好的模糊聚类图像分割算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号