首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 171 毫秒
1.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

2.
目的将数据挖掘技术应用在胶合板缺陷检测数据中,提取出有效的、正确的规则信息.方法通过分析比较粗糙集软计算方法和决策树方法的特点,利用两种方法具有的优势互补性,将其进行有机集合,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出对用户有价值的决策规则,并将其用“IF—THEN”语句表达出来.以便指导以后的决策过程.结论基于粗糙集和决策树结合的数据挖掘方法提高了获取规则的快速性,降低了计算的复杂度,增强规则的可解释性,取得了良好的研究结果.  相似文献   

3.
决策树是当前预测、决策和数据挖掘中常用的方法之一。通过对决策树的生成过程进行分析,针对现有方法中决策树过度生长带来的弊端,提出了一种结合贝叶斯推理技术思想的决策树的改进方法,并给出了该方法中数据的存储结构和决策树的生成过程。该方法利用数据挖掘所产生的规则对决策树每个分支节点的分裂条件进行判断,一方面能限制决策树生长,另一方面又能帮助选择最优线路,从而使决策效率明显提高。  相似文献   

4.
随着教育信息数据不断增加,我们面对大量数据时无法获得最有价值的知识,从而降低了数字化教学资源的作用.以武汉纺织大学线性代数课程为例,用数据挖掘工具Weka,结合关联规则和决策树方法,从往年积累的真实数据中挖掘出有价值的信息,为该课程的教学改革提供有力的理论支持.实践表明:数据挖掘技术用于教育中能提高教学效果.  相似文献   

5.
利用数据挖掘技术对当前毕业生的就业数据进行分析,发现影响就业的主要因素.其中使用C4.5算法计算了学业成绩、社团实践、获奖情况等分裂属性的增益率,以此构造决策树并对其归纳总结出一些就业规则.  相似文献   

6.
决策树是当前预测、决策和数据挖掘中常用的方法之一.通过对决策树的生成过程进行分析,针对现有方法中决策树过度生长带来的弊端,提出了一种结合贝叶斯推理技术思想的决策树的改进方法,并给出了该方法中数据的存储结构和决策树的生成过程.该方法利用数据挖掘所产生的规则对决策树每个分支节点的分裂条件进行判断,一方面能限制决策树生长,另一方面又能帮助选择最优线路,从而使决策效率明显提高.  相似文献   

7.
通过数据挖掘方法管理系统数据时,仅依靠关联规则约束,容易导致数据挖掘的泛化误差增大。因此,以顶岗实习管理系统为例,提出基于卷积神经网络的数据挖掘方法。提取顶岗实习管理系统的数据,建立面向主题的数据仓库,结合统计回归分析法和模糊聚类法生成非线性时间序列数据流,采用模糊聚类法设计数据特征提取机制。根据数据特征提取结果分析关联规则,构建卷积神经网络数据挖掘模型,通过特征压缩方法进行数据降维处理,实现挖掘数据的输出。实验结果表明:所提数据挖掘方法与基于决策树和基于一维卷积网络的方法相比,泛化误差较小,能保持在[-0.05,0.05],可以获取更加精确的信息挖掘结果,具有较好的实际应用效果。  相似文献   

8.
以数据挖掘的决策树方法为理论基础,结合燃煤锅炉的具体特点,将基于决策树归纳分类算法运用于锅炉历史运行数据的分析中.以锅炉效率为决策目标,对不同烟气含氧量、排烟温度等属性进行分类,构建决策树模型,采用决策树归纳分类的方法挖掘出指导锅炉运行的有用规则,并对挖掘结果进行分析和评价.  相似文献   

9.
利用数据挖掘中的决策树技术,对多年水库实际水文数据和调度数据进行分析和挖掘,从中得到基于多年实际径流资料和水库水位资料的调度决策树模型.模型特点:1)在海量历史水库调度数据中挖掘调度规则,从实践中得到的经验规则往往更具有实用性.2)将入流类别作为判断条件在调度规则中使用,将预报入流类别结合时间、水位生成调度规则更具有合理性.通过实例分析,比较调度决策树模型与常规水库调度图模型的结构特点和调度结果,尝试得到合理的水库兴利调度规则.  相似文献   

10.
决策树作为一种数据挖掘分类算法,不仅可以根据现存的数据库信息得出分类规则,而且可以通过友好的图形界面进行结果展示.城建档案馆在档案催交管理工作中,收集了大量的数字化信息,文中运用 C4.5 算法针对催交信息构造决策树,并利用生成的决策树辅助城建档案馆进行档案的催交管理.  相似文献   

11.
基于决策树数据挖掘的分析与应用   总被引:1,自引:1,他引:0  
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

12.
通过属性规约和属性相关分析对人口信息系统的数据进行了预处理,对预处理后的属性采用信息增益方法构造决策树,并对决策树表示的知识利用决策表的规则合并方法进行合并,据此得出了人口变动的基本规律:未婚的高学历人口和未婚、低学历的年轻人口有较高的流动率;老年人口流动率较低;其他人口的流动率一般。  相似文献   

13.
用知识发现的思想来解决决策型工艺知识获取问题。定义了工艺决策数据表(PDDT)的概念,用它存储工艺决策数据样本,并基于CLS(Concept Learning System)算法提出了一种改进的工艺决策树学习算法,采用ID3(Iterative Dichotomizer 3)算法来度量工艺决策数据表中条件属性对于工艺决策规则的重要性,进而构建工艺决策树,提出了工艺决策树简化处理的原则以及转换为工艺决策规则的方法。  相似文献   

14.
针对不确定性问题,提出了一种新的基于知识发现的信息融合的方法.对不确定问题采用精确的数学方法解决会得到不精确的结论,模糊决策树算法可以很好地解决这类问题,并能有效地提取出模糊规则.即利用模糊决策树的ID3算法对测试空间中的大量不确定多源信息数据进行综合分析、处理,建立准确的评估模型,提取隐含其中的规则,最终获取新的知识.此方法已成功应用于吉林丰满水电数字仿真系统中的考核系统.实验证明,这种知识提取方法对处理大量无序、不确定的数据很有效.  相似文献   

15.
A new classification algorithm for web mining is proposed on the basis of general classification algorithm for data mining in order to implement personalized information services. The building tree method of detecting class threshold is used for construction of decision tree according to the concept of user expectation so as to find classification rules in different layers. Compared with the traditional C4.5 algorithm, the disadvantage of excessive adaptation in C4.5 has been improved so that classification results not only have much higher accuracy but also statistic meaning.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号