首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
决策树是当前预测、决策和数据挖掘中常用的方法之一.通过对决策树的生成过程进行分析,针对现有方法中决策树过度生长带来的弊端,提出了一种结合贝叶斯推理技术思想的决策树的改进方法,并给出了该方法中数据的存储结构和决策树的生成过程.该方法利用数据挖掘所产生的规则对决策树每个分支节点的分裂条件进行判断,一方面能限制决策树生长,另一方面又能帮助选择最优线路,从而使决策效率明显提高.  相似文献   

2.
数据挖掘及在营销中的应用   总被引:3,自引:0,他引:3  
数据挖掘的目的是在大量数据中进行模式识别、提取有用的知识。西文在对数据挖掘方法作了全面论述的基础上,着重分析了关联分析方法和决策树分析方法,提出了关联衡量指标和关联分析步骤、决策树的构造方法和决策过程,并结合营销策略和商店定位两个实例讨论了方法的应用。  相似文献   

3.
对网络攻击的检测一直是入侵检测系统研究的重要课题,故提出了一种入侵检测系统的决策树生成方法。首先,使用DARPA 98林肯实验室评估数据集作为训练和测试数据集;其次,描述了从DARPA数据集学习生成决策树的整个过程;最后,实验验证了决策树作为入侵检测系统数据挖掘方法的有效性。  相似文献   

4.
数据挖掘的方法很多,决策树方法是数据挖掘方法之一。决策树方法不需要对数据进行任何假设,直接将大量数据智能地分类,按照一定的规则找出隐藏的、有价值的信息。文章选取决策树方法中具有代表性的C4.5算法,以高校学生信息管理系统中毕业就业海量信息为实例生成决策树,挖掘出有利于毕业生就业的潜在规则和因素,以便指导高校的教育和管理。  相似文献   

5.
目的将数据挖掘技术应用在胶合板缺陷检测数据中,提取出有效的、正确的规则信息.方法通过分析比较粗糙集软计算方法和决策树方法的特点,利用两种方法具有的优势互补性,将其进行有机集合,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出对用户有价值的决策规则,并将其用“IF—THEN”语句表达出来.以便指导以后的决策过程.结论基于粗糙集和决策树结合的数据挖掘方法提高了获取规则的快速性,降低了计算的复杂度,增强规则的可解释性,取得了良好的研究结果.  相似文献   

6.
在粗糙集理论的基础上提出了一种新的决策树算法,把粗糙集中的近似分类精度及决策规则的确定性因子应用于决策树的构造,在算法形成的过程中提出抑制因子,对决策树进行修剪,避免了先生成决策树再修剪的繁琐步骤,且在每次划分时对条件属性值和决策属性值进行匹配考察,避免不必要的计算,进一步提高了算法速度.  相似文献   

7.
现实世界中存在大量不相容数据.基于Rough集的有关理论,提出了一个在决策树生成过程中简单高效的识别、处理不相容数据,生成不一致决策叶节点的方法,并引入决策质量参数来刻画不一致叶节点,从而为利用决策树推理和决策提供更多有用信息.将这些方法结合进ID3算法,使算法对相容和不相容数据均可进行有效地处理.  相似文献   

8.
将数据挖掘中的决策树与粗糙集理论进行有机结合,提出一种基于粗糙集属性依赖度的决策树算法,将该算法应用到电子商务的客户管理中,进行电子商务客户价值研究,提取分类规则,为企业管理客户提供决策支持.  相似文献   

9.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的标准直接影响决策树分类的效果。基于粗糙集的属性频率函数等方法度量属性重要性的概念,将其用于分枝划分属性的选择,提出一种决策树学习算法。该方法仅利用区分矩阵就可以计算出属性的出现频率函数值,计算简单。实验结果表明,用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,结构简单,且能有效提高分类效果。  相似文献   

10.
现实世界中存在大量不相容数据.基于Rough集的有关理论,提出了一个在决策树生成过程中简单高效的识别、处理不相容数据,生成不一致决策叶节点的方法。并引入决策质量参数来刻画不一致叶节点,从而为利用决策树推理和决策提供更多有用信息.将这些方法结合进ID3算法,使算法对相容和不相容数据均可进行有效地处理.  相似文献   

11.
针对模式识别中的多分类器集成,通过挖掘测试样本特征属性的相关性,结合训练集的条件独立性分析对每个样本赋予分类规则,构造分类森林(而非单个决策树)进行模型集成。整个学习过程能够自适应确定各决策树结构和数量,并充分发挥集成模型的伸缩性和扩展性。在UCI机器学习数据集上的实验结果验证了本方法的有效性。  相似文献   

12.
介绍了空间数据挖掘技术和决策树算法。通过对其研究,将可视化空间数据挖掘技术应用于 土地定级估价,并介绍了基于VisualC++6.0和ESRI公司的MapObject2.0组件技术设计和开发了一 个可视化交互空间数据挖掘土地定级估价原型系统。系统采用决策树方法作为数据挖掘方法的基本算 法,采用训练与学习相结合实现土地定级估价。阐述了基于决策树空间数据挖掘土地定级估价的系统 模型,系统总体框架、主要模块、系统界面及系统实现定级估价的工作流程。该方法是对土地定级估价 方法的一种新的探索,是对土地信息系统开发的一种新的尝试,也是土地信息系统智能化发展的一个 方向。  相似文献   

13.
With the development of electronic technology andcomputer application,itis very hotfor us howto quick-ly,effectively and economically retrieval all relative in-formation of some thesis from Web data.Build a learn-ing model with good transparency also with…  相似文献   

14.
一种基于信息熵建立决策树的算法   总被引:2,自引:0,他引:2  
信息论给出了信息的数学本质,提出了用热力学中的熵来度量信息量的大小。分类是一个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中熵的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了信息论中有关熵的一些基本概念和含义,讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建立分类树的算法,克服了传统算法的缺点。  相似文献   

15.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

16.
构件的复用是软件复用的主要形式,大批的构件必须用一个数据库进行管理,如何从构件库中查询满足条件的构件是构件库系统的研究重点之一.数据挖掘技术为解决上述问题提供了一条可行的途径.利用数据挖掘技术中的面向属性归纳(attribute-oriented induction,AOI)对数据挖掘集进行处理得到初始工作关系,再利用判定树(decision tree)对初始工作关系进行数据概化,从而将两种方法结合起来在构件库中快速、有效地查找到有用的构件信息.通过对数据挖掘技术的应用,为复用者理解和选取构件提供了一定程度的辅助判定支持.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号