首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

2.
根据就业数据的特点,采用C4.5决策树算法对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析.  相似文献   

3.
在粗糙集理论的基础上提出了一种新的决策树算法,把粗糙集中的近似分类精度及决策规则的确定性因子应用于决策树的构造,在算法形成的过程中提出抑制因子,对决策树进行修剪,避免了先生成决策树再修剪的繁琐步骤,且在每次划分时对条件属性值和决策属性值进行匹配考察,避免不必要的计算,进一步提高了算法速度.  相似文献   

4.
为了使构造的决策树更简单,规则更容易被理解且精度更高,文章基于粗糙集理论提出了一种对属性约简及泛化的多变量决策树算法。该方法采用条件属性的加权平均粗糙度这个指标来选择测试属性构造决策树。实验表明该方法较ID3算法得到的决策树更小且分类准确率更高。文章还展望用核属性以外的条件组合属性作测试属性构造更简化的多变量决策树。  相似文献   

5.
给出了依据决策树进行知识发现的问题求解过程、策略与技术关键,提出了利用加权熵来进行决策树结构优化的方法,结合结构选型的特征对决策树基本算法ID3进行了改进;以20个高层结构实例为基础,给出了高层结构智能选型分类规则挖掘的实例及其所发现的部分选型知识;获取了1008个高层结构工程实例。建立了基于实例库与改进决策树方法的知识发现系统,为从工程实例中挖掘结构选型知识提供了方法与手段支持.实践表明,决策树方法能有效地从工程实例中开采隐含的结构选型知识,它将对充分地利用丰富的实例资源,提高结构选型设计质量与效率具有重要意义,也为解决结构智能选型知识获取“瓶颈”问题提供了一个新途径.  相似文献   

6.
针对ID3算法用信息增益作为在各级非叶节点上选择属性的标准的局限性,结合统计学独立检验思想,给出一种新的属性依赖性和重要性定义,以新的属性重要性为启发式信息设计决策树规则提取算法。实例分析的结果表明,该算法能提取更为简洁有效的决策规则。  相似文献   

7.
一个基于粗糙集和决策树的最简分类规则集生成算法   总被引:5,自引:0,他引:5  
利用粗糙集理论中属性核与不可分辨关系给出了属性约简和数据过滤算法,去除信息系统中与决策无关的冗余信号,在简化的信息系统基础上用传统算法构造决策树,总利用由粗糙度理论推出的极小、极大化学习方法对决策树规则进行极小、极大化处理,最后给出了一个最简分类规则集生成算法。  相似文献   

8.
决策树是一种重要的数据挖掘技术,本文分析了经典的ID3算法,并以我校金融工程专业程序设计课程为例,对ID3算法进行了仿真实验。实验结果表明:用检验样本对生成的决策树进行测试,测试结果符合率达91%以上。应用决策树规则对程序设计课程的总评成绩进行分析,提出了一些教学上有用的建议。  相似文献   

9.
针对传统的基于信息熵的决策树算法所存在的问题,本研究从粗糙集理论的角度来考虑信息熵,定义了依赖决策熵的概念,并提出一种基于依赖决策熵的决策树算法DTDDE。在DTDDE算法中,采用依赖决策熵的概念来度量每个条件属性的重要性,并选择重要性最大的属性作为当前的分离属性。通过在多个UCI数据集上的实验表明:与现有的决策树算法相比,本研究所提出的算法能够获得更好的分类性能。  相似文献   

10.
在教学管理工作中,学生成绩是衡量教学质量的主要依据之一。用决策树算法建立了关于学生成绩的分类规则和分析预测模型,描述了如何根据分析预测结果发现影响学生成绩的因素,进而有益于教师改进教学方法,提高学生的学习效果。选取决策属性,建立决策树,得出分类规则,结果表明本算法能够对学生数据进行正确分类,得到有价值的结论。  相似文献   

11.
决策树是当前预测、决策和数据挖掘中常用的方法之一。通过对决策树的生成过程进行分析,针对现有方法中决策树过度生长带来的弊端,提出了一种结合贝叶斯推理技术思想的决策树的改进方法,并给出了该方法中数据的存储结构和决策树的生成过程。该方法利用数据挖掘所产生的规则对决策树每个分支节点的分裂条件进行判断,一方面能限制决策树生长,另一方面又能帮助选择最优线路,从而使决策效率明显提高。  相似文献   

12.
基于决策树数据挖掘的分析与应用   总被引:1,自引:1,他引:0  
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

13.
基于数据挖掘技术的铸造产品质量预测研究   总被引:1,自引:0,他引:1  
针对铸造厂的实际生产情况,应用数据挖掘中的决策树方法,通过对大量历史数据的分析,形成了一定的质量预测规则,并以此为基础,利用神经网络的方法,建立了生产过程质量预测模型,实现铸造产品生产质量预测系统。  相似文献   

14.
决策树作为一种数据挖掘分类算法,不仅可以根据现存的数据库信息得出分类规则,而且可以通过友好的图形界面进行结果展示.城建档案馆在档案催交管理工作中,收集了大量的数字化信息,文中运用 C4.5 算法针对催交信息构造决策树,并利用生成的决策树辅助城建档案馆进行档案的催交管理.  相似文献   

15.
为从理论层次上深度解析决策树分类算法的逻辑可行性,根据可拓理论中可拓逻辑和可拓思维的全新视角,对构建决策树过程中节点的选择、规则提取和预测等步骤,进行理论上的分析和评价.以可拓思维中的菱形思维模式来分析决策树算法中节点的选择,以可拓逻辑中基元变换理论来评价决策树算法的规则提取,以可拓逻辑中的基元发散规则来解释决策树算法的预测步骤,在验证决策树算法各个步骤符合可拓理论处理矛盾问题的思维模式的同时,也对决策树算法的分类结果建立了基于可拓理论的评价体系.  相似文献   

16.
数据挖掘的方法很多,决策树方法是数据挖掘方法之一。决策树方法不需要对数据进行任何假设,直接将大量数据智能地分类,按照一定的规则找出隐藏的、有价值的信息。文章选取决策树方法中具有代表性的C4.5算法,以高校学生信息管理系统中毕业就业海量信息为实例生成决策树,挖掘出有利于毕业生就业的潜在规则和因素,以便指导高校的教育和管理。  相似文献   

17.
目的将数据挖掘技术应用在胶合板缺陷检测数据中,提取出有效的、正确的规则信息.方法通过分析比较粗糙集软计算方法和决策树方法的特点,利用两种方法具有的优势互补性,将其进行有机集合,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出对用户有价值的决策规则,并将其用“IF—THEN”语句表达出来.以便指导以后的决策过程.结论基于粗糙集和决策树结合的数据挖掘方法提高了获取规则的快速性,降低了计算的复杂度,增强规则的可解释性,取得了良好的研究结果.  相似文献   

18.
通过属性规约和属性相关分析对人口信息系统的数据进行了预处理,对预处理后的属性采用信息增益方法构造决策树,并对决策树表示的知识利用决策表的规则合并方法进行合并,据此得出了人口变动的基本规律:未婚的高学历人口和未婚、低学历的年轻人口有较高的流动率;老年人口流动率较低;其他人口的流动率一般。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号