首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
数据挖掘在旅游行业中的应用   总被引:7,自引:0,他引:7  
利用决策树分类方法对旅游数据进行挖掘的方法。结合旅游数据库的特点,对挖掘前的数据预处理工作、决策树挖掘过程作了详细的说明,并对挖掘的规则进行了分析。  相似文献   

2.
OLAP数据挖掘模型结合了微软分析服务可以访问的数据挖掘和联机分析处理两种决策机制,其创建可以借助挖掘模型向导或利用决策支持对象编程实现。采用微软决策树算法的OLAP数据挖掘模型可根据决策树、虚拟立方体和维来分析数据,并预测数据的某些特性,以帮助用户决策。  相似文献   

3.
基于多决策树算法的网络入侵检测   总被引:2,自引:2,他引:2  
将一个大数据集分割成若干个子数据集,在每个子数据集上使用决策树算法进行挖掘,用投票的方式将多棵决策树的结果结合起来,形成全局的判断。将这种方法应用于网络入侵检测,试验表明,该方法不仅提高了数据挖掘算法对海量数据的处理能力,而且降低了误判率。  相似文献   

4.
决策树算法从一组无规则、无次序的事例中推理出分类规则,同样适用于医疗数据的挖掘。本文研究基于决策树的乳腺肿瘤医疗数据的分析和挖掘,提高癌症诊断的准确率。  相似文献   

5.
新型决策树构造方法   总被引:1,自引:0,他引:1       下载免费PDF全文
决策树是一种重要的数据挖掘工具,但构造最优决策树是一个NP-完全问题。提出了一种基于关联规则挖掘的决策树构造方法。首先定义了高可信度的近似精确规则,给出了挖掘这类规则的算法;在近似精确规则的基础上产生新的属性,并讨论了新生成属性的评价方法;然后利用新生成的属性和数据本身的属性共同构造决策树;实验结果表明新的决策树构造方法具有较高的精度。  相似文献   

6.
基于决策树的医疗数据分析   总被引:10,自引:0,他引:10  
刘昆  刘业政 《计算机工程》2002,28(2):41-43,78
介绍了决策树的概念和生成过程,仔细研究了决策树的几种技术,并将它们集成到作者的决策树分析系统中,在分析了医疗数据之内后,提出了今后决策树研究的一个重要方向。  相似文献   

7.
决策树算法及其在乳腺疾病图像数据挖掘中的应用   总被引:5,自引:1,他引:5  
介绍了ID3决策树算法建立决策树的基本原理,着重介绍了决策树的修剪问题和两种典型的修剪算法-减少分类错误修剪算法和最小代价-复杂度修剪算法,并利用介绍的决策树算法和修剪算法对乳腺疾病图像进行数据挖掘,得到了一些有实际参考价值的规则,获得了很高的分类准确率,证明了决策树算法在医学图像数据挖掘领域有着广泛的应用前景。  相似文献   

8.
提出了一种针对离群数据规则挖掘的决策树构造方法。通过给出一个平均致密度的新定义和对离群数据产生机制的深入分析,提出离群数据的致密度往往比正常样本数据高的新认识,指出离群数据本质上也是不平衡数据,基于此提出了一种自动标记离群数据的新算法,并进一步在该算法和C4.5算法部分功能的基础上提出了一种基于离群数据自动标记的模糊决策树构造方法。仿真实验结果表明,该方法具有高效的离群数据规则挖掘能力,能处理不平衡数据,优化决策树的结构,挖掘出更高信任度的规则,有一定的实用价值。  相似文献   

9.
阐述了饰品企业营销的现状,提出了将数据挖掘技术应用到饰品营销中的方案.在分析决策树算法的基础上,介绍了决策树算法及决策树的构造,并使用该算法对企业客户进行分类及对新客户类型预测,实现对商业数据中隐藏信息的挖掘,且对该挖掘模型进行了验证.  相似文献   

10.
房华蓉  张毅 《数字社区&智能家居》2007,1(2):1045-1046,1068
为了进一步挖掘隐藏在销售数据背后的销售知识,本文在SQLServer中建立了汽车销售数据立方体,利用微软决策树算法分别建立的三个决策树模型。开发了符合OLEDB For DM规范的应用程序,结果显示分类正确率在85%以上。  相似文献   

11.
远程教育考试成绩分析决策树的构造方法   总被引:7,自引:2,他引:5  
介绍了数据挖掘技术在远程教育学生考试成绩分析上的应用和用ID3算法构造决策树的方法,并结合一组学生考试成绩样本数据,采用决策树分析方法进行了分类,给出了一个远程教育中成功应用数据挖掘的思路和模式。  相似文献   

12.
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。将C4.5算法应用于高校财务预警系统的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在高校财务预警调查数据分析中具有广泛的应用前景。  相似文献   

13.
《Information Fusion》2008,9(3):344-353
In real-world sensor networks, the monitored processes generating time-stamped data may change drastically over time. An online data-mining algorithm called OLIN (on-line information network) adapts itself automatically to the rate of concept drift in a non-stationary data stream by repeatedly constructing a classification model from every sliding window of training examples. In this paper, we introduce a new real-time data-mining algorithm called IOLIN (incremental on-line information network), which saves a significant amount of computational effort by updating an existing model as long as no major concept drift is detected. The proposed algorithm builds upon the oblivious decision-tree classification model called “information network” (IN) and it implements three different types of model updating operations. In the experiments with multi-year streams of traffic sensors data, no statistically significant difference between the accuracy of the incremental algorithm (IOLIN) vs. the regenerative one (OLIN) has been observed.  相似文献   

14.
Most data-mining algorithms assume static behavior of the incoming data. In the real world, the situation is different and most continuously collected data streams are generated by dynamic processes, which may change over time, in some cases even drastically. The change in the underlying concept, also known as concept drift, causes the data-mining model generated from past examples to become less accurate and relevant for classifying the current data. Most online learning algorithms deal with concept drift by generating a new model every time a concept drift is detected. On one hand, this solution ensures accurate and relevant models at all times, thus implying an increase in the classification accuracy. On the other hand, this approach suffers from a major drawback, which is the high computational cost of generating new models. The problem is getting worse when a concept drift is detected more frequently and, hence, a compromise in terms of computational effort and accuracy is needed. This work describes a series of incremental algorithms that are shown empirically to produce more accurate classification models than the batch algorithms in the presence of a concept drift while being computationally cheaper than existing incremental methods. The proposed incremental algorithms are based on an advanced decision-tree learning methodology called “Info-Fuzzy Network” (IFN), which is capable to induce compact and accurate classification models. The algorithms are evaluated on real-world streams of traffic and intrusion-detection data.  相似文献   

15.
结合递增式学习的CART算法改进   总被引:1,自引:1,他引:0  
阐述了基于gini系数的决策树构造算法--CART算法.为了使算法能处理递增的数据,引入递增式学习方法,提出了一种改进算法.递增式学习的主要思想是测试函数提升.首先使用己有的数据用CART算法生成一棵决策树,然后使用递增的数据和递增式学习的方法来修改己有的决策树.最后从理论和实践两方面证明了改进算法的正确性和有效性.  相似文献   

16.
分类在数据挖掘中是一项非常重要的任务.分类的目的是学会一个分类函数或分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个,从而用于数据分类或预测.决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型.主要研究了数据挖掘中的一种基于决策树的分类算法,以及在公交系统数据预测中的应用.在此基础上进一步讨论了ID3算法存在的一些问题并给出了解决方案和实现过程.其研究结果对开发交通规划决策支持系统具有重要的参考价值.  相似文献   

17.
在人们越来越注重效率的今天,数据挖掘这门学科已经比以往任何时候都要热门。本文报告了数据挖掘分析的现状,通过一个现实的航天数据挖掘分析的项目构架提出当今数据挖掘领域所普遍存在并没有被注意到的一些问题。并通过该航天数据挖掘分析的实践经验提出了一直被数据挖掘领域的研究者们所关注的数据挖掘的前途问题。借此使数据挖掘这门学科的应用问题能得到广大数据挖掘研究者的重视。  相似文献   

18.
基于粗糙集的决策树算法由于粒化冲突与噪声影响容易导致特征选择的失效。提出属性纯度并结合属性依赖度来构建决策树归纳算法。采用统计集成策略来建立属性纯度,表示决策分类关于条件分类的识别性,并用于相应的属性特征选择;分析属性纯度与属性依赖度的同质性和异态性,采用先属性依赖度后属性纯度选择节点的方法,改进基于粗糙集的决策树算法。决策表例分析与数据实验对比均表明所提算法的有效性与改进性。  相似文献   

19.
在人们越来越注重效率的今天,数据挖掘这门学科已经比以往任何时候都要热门。本文报告了数据挖掘分析的现状。通过一个现实的航天数据挖掘分析的项目构架提出当今数据挖掘领域所普遍存在并没有被注意到的一些问题。并通过该航天数据挖掘分析的实践经验提出了一直被数据挖掘领域的研究者们所关注的数据挖掘的前途问题。借此使数据挖掘这门学科的应用问题能得到广大数据挖掘研究者的重视。  相似文献   

20.
在分布式环境下,实现隐私保护的数据挖掘,已成为该领域的研究热点。文中着重研究在垂直分布数据中,实现隐私保护的决策树分类模型。该模型创建新型的隐私保护决策树,即由在茫然半诚实方存储的全局决策表和各站点存储的局部决策树组成,并结合索引数组和秘密数据比较协议,实现在不泄漏原始信息的前提下决策树的生成和分类。经过理论分析和实验验证,证明该模型具有较好的安全性、准确性和适用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号