期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

决策树是一种重要的数据挖掘工具,但构造最优决策树是一个NP-完全问题。提出了一种基于关联规则挖掘的决策树构造方法。首先定义了高可信度的近似精确规则,给出了挖掘这类规则的算法;在近似精确规则的基础上产生新的属性,并讨论了新生成属性的评价方法;然后利用新生成的属性和数据本身的属性共同构造决策树;实验结果表明新的决策树构造方法具有较高的精度。相似文献

6.

基于决策树的医疗数据分析 总被引：10，自引：0，他引：10

刘昆刘业政《计算机工程》2002,28(2):41-43,78

介绍了决策树的概念和生成过程，仔细研究了决策树的几种技术，并将它们集成到作者的决策树分析系统中，在分析了医疗数据之内后，提出了今后决策树研究的一个重要方向。相似文献

7.

决策树算法及其在乳腺疾病图像数据挖掘中的应用 总被引：5，自引：1，他引：5

潘永生庄天戈《计算机应用研究》2002,19(9):78-79,45

介绍了ID3决策树算法建立决策树的基本原理，着重介绍了决策树的修剪问题和两种典型的修剪算法－减少分类错误修剪算法和最小代价－复杂度修剪算法，并利用介绍的决策树算法和修剪算法对乳腺疾病图像进行数据挖掘，得到了一些有实际参考价值的规则，获得了很高的分类准确率，证明了决策树算法在医学图像数据挖掘领域有着广泛的应用前景。相似文献

8.

离群数据规则挖掘的决策树构造方法

王瑞伟李志华《计算机工程与设计》2011,32(5):1781-1784

提出了一种针对离群数据规则挖掘的决策树构造方法。通过给出一个平均致密度的新定义和对离群数据产生机制的深入分析,提出离群数据的致密度往往比正常样本数据高的新认识,指出离群数据本质上也是不平衡数据,基于此提出了一种自动标记离群数据的新算法,并进一步在该算法和C4.5算法部分功能的基础上提出了一种基于离群数据自动标记的模糊决策树构造方法。仿真实验结果表明,该方法具有高效的离群数据规则挖掘能力,能处理不平衡数据,优化决策树的结构,挖掘出更高信任度的规则,有一定的实用价值。相似文献

9.

决策树算法在饰品营销中的应用

岑琴《微型机与应用》2011,30(11)

阐述了饰品企业营销的现状,提出了将数据挖掘技术应用到饰品营销中的方案.在分析决策树算法的基础上,介绍了决策树算法及决策树的构造,并使用该算法对企业客户进行分类及对新客户类型预测,实现对商业数据中隐藏信息的挖掘,且对该挖掘模型进行了验证. 相似文献

10.

微软决策树在汽车销售中的应用

房华蓉张毅《数字社区&智能家居》2007,1(2):1045-1046,1068

为了进一步挖掘隐藏在销售数据背后的销售知识，本文在SQLServer中建立了汽车销售数据立方体，利用微软决策树算法分别建立的三个决策树模型。开发了符合OLEDB For DM规范的应用程序，结果显示分类正确率在85％以上。相似文献

11.

远程教育考试成绩分析决策树的构造方法 总被引：7，自引：2，他引：5

陶灵姣孙继银李智郭文普《计算机工程与设计》2006,27(6):976-978

介绍了数据挖掘技术在远程教育学生考试成绩分析上的应用和用ID3算法构造决策树的方法,并结合一组学生考试成绩样本数据,采用决策树分析方法进行了分类,给出了一个远程教育中成功应用数据挖掘的思路和模式。相似文献

12.

基于C4.5算法的高校财务预警系统的研究

张晓《电脑编程技巧与维护》2011,1(16):110-111,124

C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。将C4.5算法应用于高校财务预警系统的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在高校财务预警调查数据分析中具有广泛的应用前景。相似文献

13.

Real-time data mining of non-stationary data streams from sensor networks

《Information Fusion》2008,9(3):344-353

In real-world sensor networks, the monitored processes generating time-stamped data may change drastically over time. An online data-mining algorithm called OLIN (on-line information network) adapts itself automatically to the rate of concept drift in a non-stationary data stream by repeatedly constructing a classification model from every sliding window of training examples. In this paper, we introduce a new real-time data-mining algorithm called IOLIN (incremental on-line information network), which saves a significant amount of computational effort by updating an existing model as long as no major concept drift is detected. The proposed algorithm builds upon the oblivious decision-tree classification model called “information network” (IN) and it implements three different types of model updating operations. In the experiments with multi-year streams of traffic sensors data, no statistically significant difference between the accuracy of the incremental algorithm (IOLIN) vs. the regenerative one (OLIN) has been observed. 相似文献

14.

Info-fuzzy algorithms for mining dynamic data streams

Lior Cohen Gil Avrahami Mark Last Abraham Kandel 《Applied Soft Computing》2008,8(4):1283-1294

Most data-mining algorithms assume static behavior of the incoming data. In the real world, the situation is different and most continuously collected data streams are generated by dynamic processes, which may change over time, in some cases even drastically. The change in the underlying concept, also known as concept drift, causes the data-mining model generated from past examples to become less accurate and relevant for classifying the current data. Most online learning algorithms deal with concept drift by generating a new model every time a concept drift is detected. On one hand, this solution ensures accurate and relevant models at all times, thus implying an increase in the classification accuracy. On the other hand, this approach suffers from a major drawback, which is the high computational cost of generating new models. The problem is getting worse when a concept drift is detected more frequently and, hence, a compromise in terms of computational effort and accuracy is needed. This work describes a series of incremental algorithms that are shown empirically to produce more accurate classification models than the batch algorithms in the presence of a concept drift while being computationally cheaper than existing incremental methods. The proposed incremental algorithms are based on an advanced decision-tree learning methodology called “Info-Fuzzy Network” (IFN), which is capable to induce compact and accurate classification models. The algorithms are evaluated on real-world streams of traffic and intrusion-detection data. 相似文献

15.

结合递增式学习的CART算法改进 总被引：1，自引：1，他引：0

骆盈盈王柯玲陈川毛云芳《计算机工程与设计》2007,28(7):1520-1522

阐述了基于gini系数的决策树构造算法--CART算法.为了使算法能处理递增的数据,引入递增式学习方法,提出了一种改进算法.递增式学习的主要思想是测试函数提升.首先使用己有的数据用CART算法生成一棵决策树,然后使用递增的数据和递增式学习的方法来修改己有的决策树.最后从理论和实践两方面证明了改进算法的正确性和有效性. 相似文献

16.

利用数据挖掘技术对公交乘客特征状况的分析

曹洁徐强李宇任崇玉《计算机工程与设计》2007,28(17):4260-4262

分类在数据挖掘中是一项非常重要的任务.分类的目的是学会一个分类函数或分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个,从而用于数据分类或预测.决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型.主要研究了数据挖掘中的一种基于决策树的分类算法,以及在公交系统数据预测中的应用.在此基础上进一步讨论了ID3算法存在的一些问题并给出了解决方案和实现过程.其研究结果对开发交通规划决策支持系统具有重要的参考价值. 相似文献

17.

从航天数据分析看数据挖掘的前途

晁阳《数字社区&智能家居》2006,(5)

在人们越来越注重效率的今天,数据挖掘这门学科已经比以往任何时候都要热门。本文报告了数据挖掘分析的现状,通过一个现实的航天数据挖掘分析的项目构架提出当今数据挖掘领域所普遍存在并没有被注意到的一些问题。并通过该航天数据挖掘分析的实践经验提出了一直被数据挖掘领域的研究者们所关注的数据挖掘的前途问题。借此使数据挖掘这门学科的应用问题能得到广大数据挖掘研究者的重视。相似文献

18.

基于属性纯度的决策树归纳算法

姚岳松张贤勇陈帅邓切《计算机工程与设计》2021,42(1):142-149

基于粗糙集的决策树算法由于粒化冲突与噪声影响容易导致特征选择的失效。提出属性纯度并结合属性依赖度来构建决策树归纳算法。采用统计集成策略来建立属性纯度,表示决策分类关于条件分类的识别性,并用于相应的属性特征选择;分析属性纯度与属性依赖度的同质性和异态性,采用先属性依赖度后属性纯度选择节点的方法,改进基于粗糙集的决策树算法。决策表例分析与数据实验对比均表明所提算法的有效性与改进性。相似文献

19.

从航天数据分析看数据挖掘的前途

晁阳《数字社区&智能家居》2006,(2):1-2

在人们越来越注重效率的今天，数据挖掘这门学科已经比以往任何时候都要热门。本文报告了数据挖掘分析的现状。通过一个现实的航天数据挖掘分析的项目构架提出当今数据挖掘领域所普遍存在并没有被注意到的一些问题。并通过该航天数据挖掘分析的实践经验提出了一直被数据挖掘领域的研究者们所关注的数据挖掘的前途问题。借此使数据挖掘这门学科的应用问题能得到广大数据挖掘研究者的重视。相似文献

20.

基于隐私保护的决策树模型

方炜炜杨炳儒杨君周长胜《模式识别与人工智能》2010,23(6):776-780

在分布式环境下,实现隐私保护的数据挖掘,已成为该领域的研究热点。文中着重研究在垂直分布数据中,实现隐私保护的决策树分类模型。该模型创建新型的隐私保护决策树,即由在茫然半诚实方存储的全局决策表和各站点存储的局部决策树组成,并结合索引数组和秘密数据比较协议,实现在不泄漏原始信息的前提下决策树的生成和分类。经过理论分析和实验验证,证明该模型具有较好的安全性、准确性和适用性。相似文献