首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
针对目前大多数决策树挖掘中处理连续型属性方法时不考虑语义信息的问题,指出了研究数字型连续属性的语义化问题的必要性和可行性,进而提出了决策树中数字型连续属性的语义化方法,最后结合实例对该方法进行了验证。  相似文献   

2.
现在信息检索的应用已经越来越广泛,但要在具体领域中做到准确搜索,仍然是一件比较难的事情。该文提出一种基于概念语义树的语义相似度计算方法,综合考虑了概念的语义关系、层次结构和继承关系等因素,尽可能的地提高在特定领域中的信息检索效率,并最后通过实验,验证了该方法的可行性。  相似文献   

3.
数据挖掘中决策树方法的研究   总被引:3,自引:0,他引:3  
决策树是一种求解分类问题的重要技术.本文重点研究数据挖掘中的决策树方法,概述决策树方法的基本原理和优越性,阐述经典的ID3 算法并对算法进行分析,讨论若干针对分裂属性选择的改进算法,提出决策树算法理论进一步研究的方向.  相似文献   

4.
基于数据挖掘的决策树方法分析   总被引:1,自引:0,他引:1  
决策树方法因其简单、直观、准确率高等特点在数据挖掘及数据分析中得到了广泛的应用。在介绍了决策树方法的一般知识后,深入分析了决策树的生成算法与模型,并对决策树的剪枝过程进行了探讨。  相似文献   

5.
基于SPRINT方法的并行决策树分类研究   总被引:9,自引:0,他引:9  
决策树技术的最大问题之一就是它的计算复杂性和训练数据的规模成正比,导致在大的数据集上构造决策树的计算时间太长。并行构造决策树是解决这个问题的一种有效方法。文中基于同步构造决策树的思想,对SPRINT方法的并行性做了详细分析和研究,并提出了进一步研究的方向。  相似文献   

6.
分布式决策树挖掘的隐私保护研究   总被引:2,自引:0,他引:2  
数据挖掘中的隐私保护是试图在不精确访问原始数据值的前提下,挖掘出准确的模式与规则.围绕分布式决策树挖掘的隐私保护问题展开研究,提出一种基于同态加密技术的决策树挖掘算法,使各参与方在不共享其隐私信息的前提下达到集中式挖掘的效果.理论分析和实验结果表明,该算法具有很好的隐私性、准确性和适用性.  相似文献   

7.
一种基于决策树的快速关联规则挖掘算法   总被引:2,自引:0,他引:2  
陈雪飞 《计算机科学》2008,35(7):252-254
本文对关联规则的挖掘问题进行了深入研究.在总结现有算法优缺点的基础上,提出了一种新的基于决策树的快速关联规则挖掘算法(RABDT),结合决策树的构造过程,给出了算法的原理和实现步骤,并通过实验对比验证了算法的有效性.  相似文献   

8.
本体在知识表达、共享、重用以及语义查询中具有重要作用,但在本体融合过程中存在概念层融合难的问题。为此,提出一种挖掘本体概念语义的方法。该方法从实例数据出发,以实例相似度矩阵为基础,在实例层和概念层交替进行概念语义挖掘,将挖掘结果通过属性语义反馈到实例层,并对其进行修正和补充。利用OAEI2012提供的测试本体进行实验,结果显示查全率与查准率均得到提高,证明了该方法的可行性和有效性。  相似文献   

9.
分类器是数据挖掘的一种基本方法,本文首先介绍了分类器的基本概念和准确度评估方法,然后讲述了如何用决策树分类器在保险公司建立的保单及索赔信息数据库的基础上寻找保单中风险较大的要素,从而提出了一些实用的控制投资风险的规划。  相似文献   

10.
基于S-CART决策树的多关系空间数据挖掘方法   总被引:1,自引:0,他引:1  
郑向群  赵政 《计算机应用》2008,28(3):749-752
针对空间数据关系复杂的情况,提出了一种改进的多关系数据挖掘结构分类与回归树(S-CART)算法,该算法首先利用空间关联索引表抽取不同主题图层之间的关系原子命题,然后基于逻辑谓词创建多关系二叉决策树,抽取空间关联规则,同时基于我国湖北大冶部分地区土壤污染数据验证算法的有效性。  相似文献   

11.
决策树算法的研究及优化   总被引:16,自引:3,他引:16  
决策树算法是数据挖掘中的一个比较活跃的研究领域,是对分类问题进行深入分析的一种方法,但构造最优决策树是一个NP困难问题。文中首先介绍了ID3算法的基本思想,然后讨论了决策树算法中的难点问题,针对ID3算法中所存在的不足,提出了一种利用优化法的思想来改进信息增益的算法,并且与ID3算法进行了实验对比。通过实验表明,这种方法从树的规模和分类精度都优于许多决策树算法,使决策效率明显提高。  相似文献   

12.
针对分布式环境中数据自治、异构和私有的特点,提出将现有数据挖掘算法分解为分布式统计信息获取和模型生成两部分.以决策树为研究对象,分析了分布式信息需求并设计了分布式挖掘算法步骤.通过性能分析,文中算法在数据自治和通信费用上比集中式算法有优势.  相似文献   

13.
网络教育经过十年的发展,网络学院已经积累了大量的教学和学生数据。对这些数据进行整理和预处理,采用基于决策树的数据挖掘,发现相关的学习规律,帮助教务员和教师调整教学策略,提高网络教学质量。  相似文献   

14.
将数据挖掘集成到关系数据库中,可以使数据挖掘技术直接利用关系数据库中的数据生成挖掘模型.以决策树技术为研究实例,通过把决策树算法重新设计为基于SQL的汇总和查询分析操作,提出一种新的基于SQL的决策树算法.同时,通过理论分析表明,在L/O性能方面,文中算法比SPRINT算法要好.  相似文献   

15.
决策树算法是经典的分类挖掘算法之一,具有广泛的实际应用价值。经典的ID3决策树算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得无能为力。为此,对经典ID3决策树生成算法的可并行性进行了深入分析和研究,利用云计算的MapReduce编程技术,提出并实现面向海量数据的ID3决策树并行分类算法。实验结果表明该算法是有效可行的。  相似文献   

16.
数据挖掘中决策树的探讨   总被引:29,自引:1,他引:29  
决策树方法是数据挖掘中的一个重要内容。该文叙述了决策树的构建过程,并指出了其技术难点及构建算法,最后,通过一个实例给出了该算法选取决策属性的详细过程。  相似文献   

17.
决策树C4.5算法在数据挖掘中的分析及其应用   总被引:5,自引:0,他引:5  
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。分类器是数据挖掘的一种基本方法。本文对分类器的基本概念、C4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于篮球比赛的技术统计分析中,通过对这些数据分析从而得到一些较实用的预测胜负规则。  相似文献   

18.
针对电信CRM中“数据丰富但知识贫乏”的现象,利用数据挖掘技术和SL IQ决策树构造算法建立一棵决策树模型,在CRM中根据客户的年龄、所属城市和性别对客户分类,对预测客户类型,防止用户流失,争取新用户具有重要意义。  相似文献   

19.
决策树方法是发现概念描述空间的一种特别有效的方法,是实例学习中具有代表性的学习方法,专门用于处理大量对象.如何快速建立简单可靠的决策树是一个重要的问题.文章引入PSO算法,并针对标准PSO算法易限于局部极小点的局限性,在保持了PSO算法结构简单可行特点的同时,利用惩罚函数方法,引入叉乘控制项,帮助算法摆脱局部极小点的束缚,提高了优化速度.将改进的PSO引入到决策树建树方法中,并与传统的决策树方法及使用遗传算法改进后的树进行比较,验证了其优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号