首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
主成分分析(Principal Component Analysis,PCA)可以处理大量过程参数间的关系与变化,排除次要因素,提取主要因素。文章将主成分分析和决策树C4.5算法相结合,提出一种心脏病诊断预测的新方法,该方法采用PCA方法对影响心脏病诊断的众多变量进行降维处理,减少了预测模型的输入量,消除输入数据间的相关性,用C4.5算法建立心脏病诊断的预测模型。经实验证明有效的提高了C4.5算法的分类正确率,提高了心脏病诊断的正确率。  相似文献   

2.
决策树是非常流行的数据挖掘方法.介绍了决策树的理论,分析了决策树的构造,讨论了C5.0算法的思想及其优缺点,同时为深入了解影响大学生心理健康的主要心理症状及因素,将C5.0算法应用于大学生心理健康测评数据,根据挖掘结果可以更深入的了解学生心理健康问题,为高校开展好大学生心理健康教育有着现实的意义.  相似文献   

3.
为了对电力企业中不同部门的运行数据进行有效的挖掘,提出利用C5.0决策树算法对数据进行深层次分析,为管理人员提供有价值的决策支持.首先,对数据挖掘中先进的C5.0决策树算法原理进行分析,并通过引入信息熵对原有的属性选择方式进行改进,提高了信息增益比率计算的速度.然后根据设计的售电量关系模型进行对电厂管理信息系统中的数据...  相似文献   

4.
网络地址转换NAT对外网隐藏了内网的结构,这一方面给非法终端隐匿接入提供了便利,对网络造成潜在威胁;另一方面,用户也可通过NAT私自共享网络,直接损害网络运营者的利益。有效检测NAT设备,对网络安全管控、运营管理具有重要作用。文中对现有NAT检测技术进行了分析与比较,阐述了各自的优缺点和适用条件;提出了一种利用上层应用的特征和训练数据构建C5.0决策树的NAT设备检测方法。真实网络环境下的实验表明,所提方法能有效识别NAT设备。  相似文献   

5.
本文利用数据挖掘中C5.0决策树模型判别分析法建立陶瓷原料分类模型,探讨陶瓷原料的分类方法,研究结果表明:经该模型计算所得的分类结果和实际情况相吻合。该方法有助于在配方过程中遴选陶瓷原料,可在生产过程中应用和推广。  相似文献   

6.
流量分类和识别是网络流量监测活动的重要组成部分。本文指出了传统流量分类方法的不足,分析了基于机器学习的流量分类和应用识别过程,并将决策树分类算法应用到流量分类中。实验结果表明,在保证较高准确率的同时,基于决策树算法的流量分类和识别应用还具有建模速度快,适合于在线流量分类的特点。  相似文献   

7.
决策树技术是数据挖掘的重要方法,广泛应用于客户分类和预测。本文对决策树的C4.5算法的基本思想和特点进行了介绍,并结合实例说明了构造决策树的具体实现过程。  相似文献   

8.
林静 《福建电脑》2012,28(11):60-62
决策树,英文名为Deciyion Tree,是一种很久以前就开始风靡全球的人工智能技术。随着数据挖掘技术的不断进步,决策树已经成为构建决策系统不可缺少的技术,它不仅在数据挖掘方面起着关键性的作用,在数据分析方面也是一个领军者。决策树在数据挖掘中被用于预测、解决、分类等。  相似文献   

9.
决策树(Decision Tree)曾在很长的时间里是非常流行的人工智能技术,随着数据挖掘技术的发展,决策树作为一个构建决策系统的强有力的技术在数据挖掘和数据分析过程中起到了非常重要的作用.决策树在数据挖掘中主要用于分类、预测以及数据的预处理等.  相似文献   

10.
决策树算法是一种非参数化、非线性的监督分类法。以2010年8月1日Landsat TM影像为基础遥感信息源,以内蒙古自治区赤峰市中部巴林右旗、林西县、克什克腾旗、翁牛特旗交汇处的区域为研究区,通过多次修改完善训练样本数据集,然后把6个原始波段和NDVI、主成分分析后的前3个主分量、常用8个纹理特征以及3个地形特征等共21个特征变量组合成5个不同特征变量组合,采用典型决策树算法C5.0进行了遥感影像分类实验,与最大似然分类结果进行对比。结果表明:C5.0决策树的分类结果优于最大似然结果,尤其是特征变量组合恰当的时候,能够有效利用相关辅助信息,因而最终的分类结果更能满足用户需求。  相似文献   

11.
基于主成分分析的决策树构造方法   总被引:1,自引:0,他引:1  
针对传统的ID3算法在选择分裂属性上对取值较多属性过分依赖的缺点,提出了基于主成分分析的决策树优化算法.该算法是通过主成分分析综合了信息增益和相关度系数来选择分裂属性.论文通过UCI提供的标准数据集,对优化算法进行测试,分析了优化算法的性能特点,验证了优化算法在分类正确率和执行效率上要优于ID3算法.  相似文献   

12.
生存质量的研究对现代医学的影响越来越大,主要通过了解山西医科大学硕士研究生生存质量的整体状况及其影响因素,采用C4.5算法建立决策树分析模型及分类规则,有效地进行生存质量研究分析,为有针对性地制定提高研究生生存质量的干预措施,提高生存质量提供科学依据.  相似文献   

13.
一种基于FP_Tree算法的决策树构造方法   总被引:1,自引:0,他引:1  
针对大规模训练元组决策树构造效率较低的问题,提出一种改进的决策树构造方法。该方法利用FP_Tree算法,比采用经典Apriori算法节省了更多内存开销。使用FP_Tree路径替代经典算法中训练元组的分裂计算,得到与原算法相同的决策树模型。实验结果证明,改进后的方法具有良好性能。  相似文献   

14.
基于优化决策树的化工企业风险监测算法   总被引:1,自引:0,他引:1  
化工企业生产过程中的数据变化带有很强的随机性和非线性.国内的大型化工企业在生产运行中产生了大量的数据,数据属性众多,对数据属性的监控较为被动和片面.传统的基于主成份分析的数据属性分析方法,在面对大量化工数据时,数据主成份特征不明显,与危险相关的属性很可能被弱化,造成检测不准.为此提出一种区域PSO优化决策的化工企业异常情况检测方法,在使用主成份分析法对影响因素进行综合评定的基础上,在经过PSO优化权重系数后的决策树构造方法对数据的复杂情况进行寻优处理,消除大数据量的影响.实验结果证明,经优化的决策树方法能够将更加准确地对化工企业的生产平稳度进行综合控制与分析,对实际的生产有很好的借鉴作用.  相似文献   

15.
决策树C4.5算法在数据挖掘中的分析及其应用   总被引:5,自引:0,他引:5  
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。分类器是数据挖掘的一种基本方法。本文对分类器的基本概念、C4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于篮球比赛的技术统计分析中,通过对这些数据分析从而得到一些较实用的预测胜负规则。  相似文献   

16.
王鹤澎  王宏志  李建中  高宏 《软件学报》2017,28(11):2814-2824
近年来,随着现实生活中数据量的不断增大,不一致数据的出现也越发频繁,这使得人工修正不一致数据变得更加耗时.而且,人工修正数据方法本身也存在着不可避免的人为操作错误,因此,这种修正方法不再可行.如何不提前修复不一致数据,直接在不一致数据上进行分类,是该文的核心研究内容.对决策树生成算法的目标函数进行改进,使其能够直接对不一致数据进行分类,并得到较好的分类结果.对约束条件中的特征对分类结果的影响进行了多方面衡量,从而调整该特征的影响因子,使得决策树的节点分割更加精确,分类效果更优.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号