首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
根据就业数据的特点,采用C4.5决策树算法对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析.  相似文献   

2.
以数据挖掘的决策树方法为理论基础,结合燃煤锅炉的具体特点,将基于决策树归纳分类算法运用于锅炉历史运行数据的分析中.以锅炉效率为决策目标,对不同烟气含氧量、排烟温度等属性进行分类,构建决策树模型,采用决策树归纳分类的方法挖掘出指导锅炉运行的有用规则,并对挖掘结果进行分析和评价.  相似文献   

3.
数据挖掘的方法很多,决策树方法是数据挖掘方法之一。决策树方法不需要对数据进行任何假设,直接将大量数据智能地分类,按照一定的规则找出隐藏的、有价值的信息。文章选取决策树方法中具有代表性的C4.5算法,以高校学生信息管理系统中毕业就业海量信息为实例生成决策树,挖掘出有利于毕业生就业的潜在规则和因素,以便指导高校的教育和管理。  相似文献   

4.
基于决策树数据挖掘的分析与应用   总被引:1,自引:1,他引:0  
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

5.
粗糙集在数据挖掘分类规则中的应用研究   总被引:5,自引:0,他引:5  
数据集中的冗余性会降低数据挖掘结果的解释能力和精度,介绍了数据集中挖掘分类规则的基本原则,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不同相容规则的决策系统的数据挖掘算法,并应用一简单的例子说明如何在数据库中发现分类规则。  相似文献   

6.
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术.本文研究数据挖掘中的决策树算法,并利用经典的C4.5算法对网通公司业务数据进行挖掘,针对小灵通客户流失问题建立了客户流失预警模型并予以具体实现,以便为公司提供决策依据.  相似文献   

7.
决策树算法是数据挖掘中重要的分类算法,但目前多数针对决策树的改进方法都基于传统的串行算法,不能满足大数据环境下对海量数据挖掘的需要.针对大数据集中串行挖掘算法效率低下的问题,采用MapReduce对决策树算法进行了并行化实现,同时引入修正参数来改进ID3算法倾向于多值属性选取的问题.实验结果表明,该算法具有较好的并行性和扩展性,能有效处理大数据集的分类问题.  相似文献   

8.
利用数据挖掘技术对当前毕业生的就业数据进行分析,发现影响就业的主要因素.其中使用C4.5算法计算了学业成绩、社团实践、获奖情况等分裂属性的增益率,以此构造决策树并对其归纳总结出一些就业规则.  相似文献   

9.
以电力公司的业务需求为背景,为实现电力设备的状态诊断,以数据挖掘技术中的粗糙集和决策树算法为依据,采用粗糙集和决策树相结合的数据处理模型对电力设备的各属性数据进行了分析处理。综合运用粗糙集和决策树两种数据挖掘算法,通过粗糙集技术进行属性约简,并运用决策树的ID3算法对约简后的数据进行分枝、减枝得到规则集,实现对电力设备工作状态的快速、高效诊断,并根据其工作状态提供决策支持。  相似文献   

10.
目的将数据挖掘技术应用在胶合板缺陷检测数据中,提取出有效的、正确的规则信息.方法通过分析比较粗糙集软计算方法和决策树方法的特点,利用两种方法具有的优势互补性,将其进行有机集合,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出对用户有价值的决策规则,并将其用“IF—THEN”语句表达出来.以便指导以后的决策过程.结论基于粗糙集和决策树结合的数据挖掘方法提高了获取规则的快速性,降低了计算的复杂度,增强规则的可解释性,取得了良好的研究结果.  相似文献   

11.
基于决策树的ID3算法与C4.5算法   总被引:1,自引:0,他引:1  
论述了在数据挖掘中基于决策树的ID3算法以及C4.5算法,说明了两种算法的优缺点.通过实例解析了ID3算法和C4.5算法的实现过程,能够直观看出C4.5算法相比较与ID3算法的优越性.  相似文献   

12.
决策树作为一种数据挖掘分类算法,不仅可以根据现存的数据库信息得出分类规则,而且可以通过友好的图形界面进行结果展示.城建档案馆在档案催交管理工作中,收集了大量的数字化信息,文中运用 C4.5 算法针对催交信息构造决策树,并利用生成的决策树辅助城建档案馆进行档案的催交管理.  相似文献   

13.
以提高信用等级评价的质量为目的,介绍了数据挖掘技术的基本过程.以企业贷款的信用分类为研究背景,具体研究了业务理解、数据理解、数据准备、建模、评估和发布的实现环节.在建模过程中,采用决策树为分析模型,对经典的C4.5算法进行了改进.将改进算法运用在企业贷款的信用分类中,并将其效果与经典的C4.5算法的结果进行比较,结果表明该算法对于企业信用分类这样的复杂系统,在准确度与决策树结构上具有一定程度上的改善,能够提高信用等级评价质量.  相似文献   

14.
对福建某高校二级学院2016年毕业生就业信息进行预处理,从统计分析、构建决策树模型两方面开展研究。在Weka中采用C4.5(J48)算法构建了决策树,根据分析及构造的决策树模型,从人才培养方案、奖励制度、在校学生的就业规划提出了相关建议,为就业指导部门和高校领导提供一定的决策帮助。  相似文献   

15.
以已投入使用的健身俱乐部管理系统为背景,提出了用C4.5决策树分类算法对健身记录进行数据挖掘。通过该方法找出俱乐部在有效期内的会员的年龄段、性别、会员卡类型和参与健身时间段的规律,提取特定时间段内参与健身的会员特征。实验结果表明:将该分类规则应用到会员管理系统中,可以辅助健身俱乐部的管理者有针对性地制定营销方案。  相似文献   

16.
数据挖掘技术在高校学生就业指导决策中的运用   总被引:1,自引:0,他引:1  
高校学生的招生、就业等信息数量庞大,表目繁多,对这些数据有效地进行预处理,并进一步挖掘以获得有利于高校教学管理决策和毕业生就业指导的有用信息,具有重要意义.以沈阳市某高校学生招生就业数据为基础,建立了一个基于学生信息的关联规则挖掘系统,并对其中的Apriori算法进行优化,同时对由频繁项集生成关联规则的算法给予改进,挖掘结果中产生了大量有益信息,通过实际检验,该优化算法能避免大量无意义关联规则的产生并提高挖掘效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号