首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
基于S-CART决策树的多关系空间数据挖掘方法   总被引:1,自引:0,他引:1  
郑向群  赵政 《计算机应用》2008,28(3):749-752
针对空间数据关系复杂的情况,提出了一种改进的多关系数据挖掘结构分类与回归树(S-CART)算法,该算法首先利用空间关联索引表抽取不同主题图层之间的关系原子命题,然后基于逻辑谓词创建多关系二叉决策树,抽取空间关联规则,同时基于我国湖北大冶部分地区土壤污染数据验证算法的有效性。  相似文献   

2.
随着大数据时代的发展,数据信息在生活中被越来越多地使用,数据分析的应用也越来越广泛。数据挖掘的算法以及关联分析是在大量数据集中寻找一些内部联系。Apriori算法通过对一些模型和关联规则的研究,可以在大量的数据中发现一些事物之间的关系,这有助于做出更好的决策,现广泛应用于商业领域,用于消费者市场价格分析,它可以快速找出各种产品之间的价格关系及其影响。  相似文献   

3.
关联规则技术是数据挖掘的最重要的组成部分之一,它用于发现大量数据中项集之间的有意义的关联和相关联系。本文介绍了使用关联规则挖掘算法FP-growth分析学生选课数据的方法。  相似文献   

4.
多决策树融合模型MDTF的研究   总被引:1,自引:0,他引:1  
基于数据挖掘的入侵检测系统中存在着检测性能低和数据挖掘效率不高等问题.为了解决这些问题,提出了多决策树融合模型MDTF,也就是把海量数据集分成若干子数据集,在子数据集上进行挖掘形成不同的子决策树,然后用加权平均法将多棵子决策树对网络数据的检测结果进行融合形成最优判断.实验采用KDD99数据,实验结果表明,该方法可以得到较好的入侵检测性能,分布并行处理可以提高数据挖掘效率.  相似文献   

5.
由于网络数据流量的急剧膨胀,人们迫切希望对流量数据进行更深层次的分析,以发现隐藏在数据中的知识。但传统的网络流量监测和分析系统无法完成这一任务。作者采用基于冰山查询的关联规则挖掘方法,对网络流量与各IP之间的联系进行关联分析,取得了较好的效果。  相似文献   

6.
分类是数据挖掘的一种非常重要的方法。分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型。该函数或模型能够把数据库中的数据记录映射到给定类别中的某一个,从而可以应用于数据预测。大部分数据挖掘工具采用规则发现或决策树分类技术来发现数据模式和规则,其核心是某种归纳算法。这类工具通常是对数据库的数据进行开采,生产规则和决策树,然后对新数据进行分析和预测。本文研究基于SLIQ的数据挖掘分类算法。  相似文献   

7.
数据挖掘就是从大量数据中,抽取隐含的、但又是潜在有用的关联信息和知识的发现过程。其中关联规则(AssociationRules)的挖掘是一个重要的问题,是大量数据中项集之间有趣的关联或相关联系。本文论述了如何改进关联规则算法,使之可以挖掘数量型数据,并利用改进的关联规则算法对游客数据进行数据挖掘,从而得到一些对旅游经营有用的知识。  相似文献   

8.
决策树(Decision Tree)曾在很长的时间里是非常流行的人工智能技术,随着数据挖掘技术的发展,决策树作为一个构建决策系统的强有力的技术在数据挖掘和数据分析过程中起到了非常重要的作用.决策树在数据挖掘中主要用于分类、预测以及数据的预处理等.  相似文献   

9.
一种多变量决策树的构造与研究   总被引:3,自引:0,他引:3       下载免费PDF全文
单变量决策树算法造成树的规模庞大、规则复杂、不易理解,而多变量决策树是一种有效用于分类的数据挖掘方法,构造的关键是根据属性之间的相关性选择合适的属性组合构成一个新的属性作为节点。结合粗糙集原理中的知识依赖性度量和信息系统中条件属性集的离散度概念,提出了一种多变量决策树的构造算法(RD)。在UCI上部分数据集的实验结果表明,提出的多变量决策树算法的分类效果与传统的ID3算法以及基于核方法的多变量决策树的分类效果相比,有一定的提高。  相似文献   

10.
提出了基于数据抽取器的知识发现模型。在模型中,将知识发现过程分成数据预处理、数据抽取、数据挖掘和结果分析四个阶段。该模型利用标准的SQL语言构造数据抽取器,为不同的学习算法准备数据,减少数据挖掘算法对数据库直接调用的次数,避免了直接对大型数据库的数据进行调用,使得对大型数据库进行快速数据挖掘成为可能。可以加快知识发现过程,提高数据挖掘效率,实现对于大型数据库的知识发现。最后设计了SQL-C4.5算法,该算法实现了利用数据抽取器为决策树算法C4.5抽取必要的统计数据,实现了C4.5决策树的构建。  相似文献   

11.
分布式决策树挖掘的隐私保护研究   总被引:2,自引:0,他引:2  
数据挖掘中的隐私保护是试图在不精确访问原始数据值的前提下,挖掘出准确的模式与规则.围绕分布式决策树挖掘的隐私保护问题展开研究,提出一种基于同态加密技术的决策树挖掘算法,使各参与方在不共享其隐私信息的前提下达到集中式挖掘的效果.理论分析和实验结果表明,该算法具有很好的隐私性、准确性和适用性.  相似文献   

12.
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。将C4.5算法应用于高校财务预警系统的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在高校财务预警调查数据分析中具有广泛的应用前景。  相似文献   

13.
在分布式环境下,实现隐私保护的数据挖掘,已成为该领域的研究热点。文中着重研究在垂直分布数据中,实现隐私保护的决策树分类模型。该模型创建新型的隐私保护决策树,即由在茫然半诚实方存储的全局决策表和各站点存储的局部决策树组成,并结合索引数组和秘密数据比较协议,实现在不泄漏原始信息的前提下决策树的生成和分类。经过理论分析和实验验证,证明该模型具有较好的安全性、准确性和适用性。  相似文献   

14.
对校园网主干数据流中IP地址进行聚类,可以得到网络用户访问地址的分布概况从而了解用户行为特征。已有聚类算法大都将IP地址作为普通数字考虑,忽略了其特征属性以致聚类结果不合理。为此提出一种改进算法:首先基于最长前缀匹配和改进的最近邻规则算法得到初始聚类,然后运用逐步优化层次聚类的思想进一步聚合最靠近子类,最终得到基于IP地址特征属性的聚类。实验结果表明该算法与以往算法相比,提高了聚类效果,具有较好的准确性和可行性。  相似文献   

15.
林瑞  钟诚  华蓓 《计算机应用》2013,33(12):3437-3440
从多方合作挖掘分布存储在不同计算站点上多个数据库表而不泄露各方原始数据信息的目的出发,对于每个站点拥有多个数据表的分布式计算环境,基于三方安全协议,运用生成随机数扰乱方法,采取各站点并行挖掘频繁项集,将站点间各表数据公共连接属性作等值连接,以安全协议计算全局站间跨表频繁项集支持数的策略,提出了一站多表的3站点跨多表频繁项集挖掘隐私保护算法。实验结果表明,该算法在高效地联合挖掘出跨多表频繁项集的同时保护了各站点的敏感信息。  相似文献   

16.
对于高校就业管理信息系统中积累的大量数据,运用数据挖掘算法中的决策村方法挖掘出潜在的有用的信息,为高校开展就业工作提供决策支持.根据就业数据的特点,采用C4.5决策树算法,对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析.  相似文献   

17.
分类在数据挖掘中是一项非常重要的任务.分类的目的是学会一个分类函数或分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个,从而用于数据分类或预测.决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型.主要研究了数据挖掘中的一种基于决策树的分类算法,以及在公交系统数据预测中的应用.在此基础上进一步讨论了ID3算法存在的一些问题并给出了解决方案和实现过程.其研究结果对开发交通规划决策支持系统具有重要的参考价值.  相似文献   

18.
一种改进的TCP拥塞控制算法   总被引:1,自引:1,他引:1  
目前,TCP拥塞控制算法作为一种可靠的数据传输被广泛应用在因特网中.在保证网络数据传输可靠性的基础上,数据流之间的公平性是算法设计的重要的性能指标之一.在单瓶颈网络环境下对TCP数据流之间的研究算法已经被提出,但对多瓶颈网络环境下TCP数据流之间的公平性研究至今不多见.因此,根据网络层的显示拥塞指示Marking Relay ECN(explicit congestion notification,ECN)技术,研究了在多瓶颈网络环境下TCP数据流的公平性,提出了一种改进的TCP拥塞控制算法,并使该算法在IP网络中得以实现.仿真结果证明,此算法在多瓶颈网络环境下能使TCP流达到较好的数据流之间的公平性;而且所提出的算法与传统的TCP算法相比,有更高的吞吐量和更快的响应.总之,所提算法性能表现良好.  相似文献   

19.
近年来,随着互联网技术飞速发展与普及,大量社交网络平台迅速崛起。社交网络平台拉近了日常人际关系,提供了便捷的信息通讯交流通道。同时,针对社交网络平台数据挖掘的技术研究成为不可缺少的网络数据研究领域一部分。现有社交网络数据挖掘技术所采用的传统数据挖掘算法与数据分离模式,存在大数据多元特征条件下,数据挖掘准确度降低、挖掘分类逻辑混乱等现象。针对问题产生根源,提出基于朴素贝叶斯算法的社交网络数据挖掘技术研究。采用基于朴素贝叶斯算法设计的PCIE-FN社交网络数据挖掘平台进行全面化的深入性解决。通过实验证明,提出的基于朴素贝叶斯算法的社交网络数据挖掘技术研究,各项数据满足社交网络数据挖掘日常应用要求。  相似文献   

20.
数据仓库中的一种提高多表连接效率的有效方法   总被引:4,自引:0,他引:4  
联机分析处理OLAP查询经常涉及多表连接,所以提高多表连接的性能就成了提高OLAP查询处理的关键性问题.针对目前直接提高多表连接效率的方法、并行多表连接算法和连接索引,提出了变形多表连接索引.该方法基于使用SQL语句表述的查询模型库QMB建立一系列符合条件的变形多表连接事实表,并建立这些变形多表连接事实表的索引.在特定的多表连接查询中,变形多表连接事实表能替代原事实表与各维表连接,并在查询处理过程中动态更新.理论分析和实验结果表明,该方法可以有效地提高多表连接的查询效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号