首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
在关联规则数据挖掘中采用二进制系统易于产生冗余模式。该文提出一种基于二进制事务属性层次划分的两级数据挖掘方法,即MLADM算法。该算法通过高层次模式获取最大可能频繁模式集,在低层次模式中对其进行验证,优先获得长频繁模式。实验结果表明,该算法可以在密集数据集中有效挖掘长模式并避免冗余模式。  相似文献   

2.
基于二进制的长频繁项空间数据挖掘算法   总被引:4,自引:0,他引:4  
提出一种基于二进制的空间关联规则挖掘算法,它适合挖掘长频繁项目集和同一空间关系模式下不同对象之间的关联。算法从搜索策略、修剪策略和存储结构三个方面改进了现有的二进制关联规则挖掘算法,并用数字特征来减少被扫描事务的个数,减少了算法的执行时间;将其用在单一的空间数据挖掘中效率得到了明显提高。  相似文献   

3.
二进制挖掘算法在空间数据挖掘中的应用   总被引:1,自引:0,他引:1  
现有的传统关联规则挖掘算法构建频繁候选项的方式和修剪技术是其应用于空间数据挖掘的技术难题.针对空间数据挖掘中数据库的属性特点,将基于二进制的挖掘算法应用于空闻数据挖掘中.该算法用二进制的逻辑运算产生频繁候选项和计算支持数,有效地解决了现有挖掘算法在空间数据库中提取关联规则时存在的难题.  相似文献   

4.
关联规则在零售商业的应用   总被引:6,自引:0,他引:6  
肖劲松  林子禹  毛超 《计算机工程》2004,30(3):189-190,195
就数据挖掘中关联规则的概念和作用进行了探讨,对关联规则中寻找大项集的关键算法作出了剖析,提出了衡量关联规则价值的方法,并给出了关联规则在零售商业中的几类典型应用,并获得了较好的应用效果。  相似文献   

5.
大数据时代,人们获取所需信息的困难度提高,而数据挖掘是当下解决此问题的关键技术。Apriori算法作为数据挖掘中的常用算法,通过挖掘数据背后的潜在关联规则。考虑到传统Apriori算法执行过程中,数据扫描频繁、候选集获取繁琐等问题,提出采用加权Apriori算法,即将冗余记录存储一次,并将记录的重复次数占全部记录数的比值作为权重,压缩空间;采用二进制的布尔矩阵替代原有数据集,通过矩阵内部“与运算”,获取最大频繁集,降低时间复杂度。考虑到原始数据冗余性以及粗糙集属性约简的不精确性,在提取关联规则前,提出采用多粒度粗糙集的属性约简算法,通过知识粒度细化属性值来提高约简精度,降低空间复杂度。最后,将所提方法与基于频繁矩阵的Apriori算法以及原始Apriori算法进行比较,验证所提方法的实用性和有效性。  相似文献   

6.
关联规则的高效挖掘算法研究   总被引:4,自引:0,他引:4  
关联规则的挖掘是一个重要的数据挖掘问题,对其挖掘算法的研究具有十分重要的意义,经典的关联规则发现算法是一个多次遍历的算法,计算的复杂度较同,本文给出一种关联规则频繁数据集的发现算法,只需对交易序列扫描两次即可发现数据采的频繁数据集,算法效率得到了较好地提高。  相似文献   

7.
数据挖掘的关联规则建立与算法改进   总被引:4,自引:0,他引:4  
关联规则作为一种数据挖掘的工具,能够发现数据项集之间有趣的关联。在关联规则的算法中,Apriori算法是其中的关键算法之一。本文提出利用频繁K-项集导出关联规则后得到的有用信息指导频繁(K 1)一项集产生的方法,通过矩阵、事务剪枝和分区查找有效的提高了Apriori算法的效率。  相似文献   

8.
张春生  庄丽艳 《计算机应用》2013,33(10):2796-2800
Apriori关联规则数据挖掘算法只针对一类相关数据集进行数据挖掘,而现实世界中各种不同的数据集非常庞大,如何在不相关数据集间进行数据挖掘,拓展规则的数量具有挑战性。目前Apriori关联规则算法研究基本上集中在算法性能优化和针对不同数据形式的基础上,没有突破不相关数据集的界限。针对这个问题,首先给出了相关数据集、不相关数据集、相容数据集的概念,进一步给出了一种基于Apriori的不相关数据集中相容数据集间的关联规则演绎算法,给出了算法演绎规则,通过构建法证明了算法的正确性。通过实例演示了应用方法,该算法可实现基于Apriori的相容数据集间关联规则的规则演绎,是普通数据挖掘算法无法实现的,扩展了关联规则算法的应用领域;同时,由于关联规则是在相容数据集上独立挖掘出来的,没有进行原始数据间的交换,在一定程度上实现了隐私保护  相似文献   

9.
有效支持度和模糊关联规则挖掘   总被引:3,自引:0,他引:3  
关联规则挖掘是数据挖掘的重要研究内容,将模糊的思想融入数据挖掘,形成的模糊关联规则的挖掘是当前关联规则研究的新方向,本文在模糊关联规则的挖掘中提出了有效支持度的概念,使其用于频繁模糊模式集的挖掘、挖掘的结果更为简洁和合理,同时挖掘的效率也得到了提高。  相似文献   

10.
基于分布数据库的快速关联规则挖掘算法   总被引:8,自引:0,他引:8  
关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。  相似文献   

11.
关联规则挖掘是经典的数据挖掘方法,越来越多的企业都把它看作是必不可少的战略分析工具。当前关联规则挖掘方法得到的规则过多,令用户在运用时难以理解,因此研究关联规则集的约简方法具有应用价值。研究了数据库模式中关键字包含的主属性对基于Apriori算法的关联规则挖掘产生的关联规则的影响,即部分函数依赖会导致关联规则挖掘的数据集中冗余信息的频繁出现,并产生没有实际价值的关联规则,识别并消除这样的规则就能实现规则集的约简。求全部主属性如同求所有候选关键字问题都是NP难题,因此提出了一种基于一个候选关键字进行验证的算法来判定主属性,从而完成基于主属性判定的关联规则挖掘约简算法的设计与实现,并在最后的实验中验证了该算法的有效性。   相似文献   

12.
李广璞  黄妙华 《计算机科学》2018,45(Z11):1-11, 26
关联分析作为数据挖掘的主要研究模块之一,主要用于发现隐藏在大型数据集中的强关联特征。而多数关联规则挖掘任务可分为频繁模式(频繁项集、频繁序列、频繁子图)的产生和规则的产生。前者发现数据集中满足最小支持度阈值的项集、序列与子图;后者从上一步发现的频繁模式中提取高置信度的规则。频繁项集挖掘是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心。十几年来,学者们致力于提高频繁项集的生成效率,从不同的角度进行改进以提高算法效率,大量的高效可伸缩性算法被提出。文中对频繁项集挖掘进行深入分析,对完全频繁项集、闭频繁项集、极大频繁项集的典型算法进行介绍和评述,最后对频繁项集挖掘算法的研究方向进行简要分析。  相似文献   

13.
一种改进的关联规则算法探讨   总被引:5,自引:1,他引:4  
黄建设 《计算机仿真》2005,22(12):72-75
随着以数据库、数据仓库等数据仓储技术为基础的信息系统在各行各业的应用,使海量数据不断产生。而数据采集手段的丰富,使获取、保存大量数据变得容易,从庞杂的数据中提取有用的知识和信息是数据挖掘的主要任务,关联规则是数据挖掘领域的一个重要分支。该文以数据挖掘为研究背景,讨论了数据挖掘中确定关联规则的一种方法,并提出改进算法。在研究算法的同时提供了一种数据项的二进制编码技术,对于提高数据信息的处理能力和可靠性有一定意义。  相似文献   

14.
一种新的普遍化关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出了一种新颖的普遍化关联规则挖掘算法GARL。该算法连续扫描数据库事务序列,在最多不超过两遍扫描后生成所有频繁项目集,在首次扫描数据库时,能为用户给出反馈信息,允许用户对最小支持率进行调整,该算法能连续处理事务序列,可用于网上在线数据挖掘。  相似文献   

15.
刘均  李人厚  郑庆华 《计算机工程》2005,31(9):17-18,33
针对基于区间划分的数值型关联规则分析方法存在的问题,提出了一种基于进制转换的分析方法.此方法将十进制的属性值转换为二进制,并将二进制数值的每一位映射为二个布尔型属性,在此基础上,再采用布尔型关联规则分析方法.相对于基于区间划分的方法,此方法的优点是转化过程不存在失真,且能有效地降低后续分析过程的时间复杂度.  相似文献   

16.
关联规则是数据挖掘的一种常用方法。本文以Apriorl算法中频繁项集的概念为基础,在加入了元向量、子规则、父规则等概念后,提出一种关联规则挖掘的改进方法(Improve算法)。该方法克服了传统关联规则挖掘方法的不足,在产生频繁项集的同时进行规则挖掘,从而提高了挖掘效率。  相似文献   

17.
提出了一种基于事务序列的关联挖掘方法实现对足球视频的摘要挖掘。处理过程分为视频数据预处理、视频属性提取和视频摘要挖掘等三个步骤。视频数据预处理阶段将原始视频流切分成物理镜头。视频属性提取阶段先将物理镜头分成五种类型,将视频转换成镜头标识序列,以事务为单位对标识序列进行切分形成事务序列,构造一种关系数据库来存储这些事物序列数据。在视频摘要挖掘阶段,采用传统的Apriori算法对事务数据库进行关联挖掘获得关联模式,以挖掘出的关联模式为依据形成视频摘要。实验结果表明,挖掘精彩事件的查全率和查准率较高,具有实用价值。  相似文献   

18.
频繁集挖掘是总结二进制数据的重要技术,但如何找到一个二进制数据集与频繁集挖掘结果相一致却十分困难。文中从可计算复杂度的观点研究了频繁集的隐私保持。特别分析了反频繁挖掘问题的可计算复杂度。给出了决定是否存在与一个已知频繁集兼容的数据集是一个NP难度问题;当原始数据集d由6个集合组成时计算与已知频繁集兼容的数据集的数量是一个P类完全问题。  相似文献   

19.
针对不确定性数据中模糊关联规则的挖掘问题,提出一种基于群搜索优化(GSO)算法优化隶属度函数(MF)的模糊关联规则挖掘方法。首先,将不确定性数据通过三元语言表示模型进行表示;然后,给定一个初始MF,并以最大化模糊项集支持度和语义可解释性作为适应度函数,通过GSO算法的优化学习获得最佳MF;最后,根据获得的最佳MF,利用改进型的FFP-growth算法来从不确定数据中挖掘模糊关联规则。实验结果表明,该方法能够根据数据集自适应优化MF,以此实现从不确定数据中有效地挖掘关联规则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号