首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
数据挖掘就是从大量数据中,抽取隐含的、但又是潜在有用的关联信息和知识的发现过程。其中关联规则(AssociationRules)的挖掘是一个重要的问题,是大量数据中项集之间有趣的关联或相关联系。本文论述了如何改进关联规则算法,使之可以挖掘数量型数据,并利用改进的关联规则算法对游客数据进行数据挖掘,从而得到一些对旅游经营有用的知识。  相似文献   

2.
数据流中的关联规则在预测和在线分析系统中有重要应用.现有的研究大多集中在事务数据模型上,鲜有对数据项之间的关联规则挖掘.由于数据的实时性特点,用户又往往对新产生的数据所包含的信息更感兴趣.为了实时而准确地挖掘最近一段时间内数据项间的关联规则,提出了MARSW(mining association rules on sliding window)算法,利用滑动窗口模型对数据流进行关联规则挖掘.MARSW算法在给定的误差范围内,能够有效去除历史数据的影响,并以有限的空间代价快速挖掘大量数据间存在的关联规则.大量仿真实验结果表明,MARSW算法具有较高的效率和优良的可扩展性.  相似文献   

3.
关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产生的三角形迭代选择初始点,再将删除冗余后的规则进行聚类.实验证实本文方法将相似的关联规则归为一簇,能有效的帮助用户迅速找到有用的关联规则,有助于用户更好的对规则进行理解和分析,提高了聚类的效率.  相似文献   

4.
一种改进的Apriori算法   总被引:4,自引:2,他引:4  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apaod进行分析,发现该技术存在的问题.Apriori算法是关联规则挖掘中的经典算法.对Apriori算法做了改进.借助0-1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率.  相似文献   

5.
由于数据库的频繁更新,时态数据库隐藏了大量的未知信息,因此针对实时更新的数据库应产生相应的时态关联规则.虽然关联规则算法已经被深入广泛地研究,但在文本数据中时态关联规则算法的研究还不多见.在深入了解时态关联规则算法及其在文本数据中的研究价值后,以时态文本为对象进行了时态关联规则算法的研究,建立了时态文本数据的时间表示模型,提出了文本时态关联规则算法SPFM,最后通过实验对算法进行了有效性验证,结果表明该算法是正确可行的.  相似文献   

6.
信息时代的到来,产生了大量的数据.在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会创造很多潜在的利润.关联规则的挖掘已被广泛应用在实际生活中.但过去的研究往往认为数据库各个项目的重要程度是相同的,而事实上,用户对项目的看重程度是不同的,因此已有算法挖掘出来的并不一定是我们感兴趣的规则.针对这种情况,提出了加权关联规则.  相似文献   

7.
高校选课系统中存储了大量的数据,利用数据挖掘技术的关联规则挖掘,可以从大量的数据中发现有价值的规则.以高校选课系统为应用背景,对学生成绩进行分析,得出部分合理、可靠的课程相关性规则,为学分制体系下学生选课提供指导.  相似文献   

8.
基于"新颖度"的关联挖掘算法   总被引:2,自引:2,他引:0  
关联挖掘的目的是从大量数据中发现对用户有用、新颖、重要的关联规则.传统的关联挖掘算法会产生大量对用户而言显而易见的平凡规则,使那些真正对用户有用的新颖规则被淹没,而一些针对新颖性的改进算法往往又存在先验知识表达复杂且工作量极大的问题.在本文中,我们运用简单的分类树,引入"新颖度"的概念,对Apriori算法进行改进,得到了基于"新颖度"的关联挖掘算法,此算法既充分考虑了挖掘过程中得新颖性问题,又克服了先验知识表达过于复杂的困难.  相似文献   

9.
关联规则挖掘方法的应用研究   总被引:5,自引:0,他引:5  
在激烈的人才竞争中,人才的评估和选拔起着至关重要的作用.关联规则挖掘方法作为数据挖掘的一种工具.能系统地检查和理解大量数据,可以有效地帮助企业从众多的人才数据中提取有价值的信息.文章从人才评估的研究入手,应用关联规则挖掘方法对人才的评估和选拔工作进行了探讨.  相似文献   

10.
数据采集手段的丰富,使获取、保存大量数据变得容易,从庞杂的数据中提取有用的知识和信息是数据挖掘的主要任务,关联规则是数据挖掘领域的一个重要分支。本文针对事务数据库中增加新的数据集后相应关联规则的更新和维护问题,提出了一种关联规则增量式增量算法  相似文献   

11.
聚类及关联规则挖掘是数据挖掘领域中的两种重要方法。先使用聚类法将比较接近的数据分为同一簇,再分别对已经减少了数据量的每一簇作关联规则挖掘,这样,结合了两种方法的优点,改进了仅使用单一方法的缺点,能够获得更多的信息,有助于更加容易且有效地分析数据。  相似文献   

12.
农村社会保障体系数据流关联规则挖掘   总被引:2,自引:0,他引:2       下载免费PDF全文
针对我国农村社会保障体系数据流存在的隐含信息,对该体系数据流关联规则挖掘已成为研究的热点。鉴于此,提出农村社会保障体系数据流产生关联规则的几个步骤及相应的实现方法,包括在数据流采样中的置换方法,以及在频繁集生成中的MFI—TCQ方法,介绍关联规则树的产生并举例进行说明。  相似文献   

13.
数据采集手段的丰富,使获取、保存大量数据变得容易,从庞杂的数据中提取有用的知识和信息是数据挖掘的主要任务,关联规则是数据挖掘领域的一个重要分支。本文针对事务数据库中增加新的数据集后相应关联规则的更新和维护问题,提出了一种关联规则增量式增量算法  相似文献   

14.
信息时代的到来,产生了大量的数据。在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会创造很多潜在的利润。关联规则的挖掘已被广泛应用在实际生活中。但过去的研究往往认为数据库各个项目的重要程度是相同的,而事实上,用户对项目的看重程度是不同的,因此已有算法挖掘出来的并不一定是我们感兴趣的规则。针对这种情况.提出了加权关联规则。  相似文献   

15.
空间数据挖掘是从空间数据库中抽取隐含知识、空间关系及空间数据库中存储的其它信息的方法。空间关联规则是空间数据挖掘的一个重要研究领域,利用空间关联规则把空间数据库中的数据转化为知识是一个很好的方法。在分析空间关联规则的基础上,用基于关联规则的逐步求精挖掘算法,得出空间数据库中的隐含知识,通过实例证明其方法的可行性。  相似文献   

16.
概念格上无冗余关联规则的提取算法NARG   总被引:2,自引:0,他引:2       下载免费PDF全文
在数据挖掘中,关联规则是很有价值的一类规律。普通的挖掘算法会产生大量的规则,尤其是当最小支持度和最小可信度减少时,关联规则的数目急剧上升。如何对规则进行约减而又不丢失数据信息是消除冗余关联规则的关键。根据概念格的理论和冗余关联规则的性质,提出在概念格上提取无冗余关联规则的NARG算法。该算法可以得到最小的无冗余的关联规则集,而且不丢失任何信息,可有效提高关联规则生成的效率。  相似文献   

17.
Today, development of e-commerce has provided many transaction databases with useful information for investigators exploring dependencies among the items. In data mining, the dependencies among different items can be shown using an association rule. The new fuzzy-genetic (FG) approach is designed to mine fuzzy association rules from a quantitative transaction database. Three important advantages are associated with using the FG approach: (1) the association rules can be extracted from the transaction database with a quantitative value; (2) extracting proper membership functions and support threshold values with the genetic algorithm will exert a positive effect on the mining process results; (3) expressing the association rules in a fuzzy representation is more understandable for humans. In this paper, we design a comprehensive and fast algorithm that mines level-crossing fuzzy association rules on multiple concept levels with learning support threshold values and membership functions using the cluster-based master–slave integrated FG approach. Mining the fuzzy association rules on multiple concept levels helps find more important, useful, accurate, and practical information.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号