共查询到18条相似文献,搜索用时 297 毫秒
1.
频繁项集快速挖掘及更新算法 总被引:2,自引:0,他引:2
为了克服Apriori发现频繁项集存在的问题,提出了一种基于三维项集矩阵和向量(TIMV)的频繁项集挖掘算法.该算法摆脱了Apriori框架的束缚,仅需扫描数据库一次,不产生候选项目集.当事务数据库和最小支持度发生变化时,该算法只需重新遍历一次项集矩阵,即可得到新的频繁项集.实验结果表明,算法能有效提高频繁项目集的挖掘和更新效率. 相似文献
2.
加权最大频繁项目集挖掘算法 总被引:2,自引:0,他引:2
关联规则是数据挖掘领域的一个重要分支,而发现最大频繁项目集是关联规则挖掘中的重要问题.最大频繁项目集挖掘是在数据库中各属性之间是平等的情况下进行的,但现实中并非如此.频繁模式树(Frequent Pattern Tree,FP-Tree)已不能满足要求.为此提出了一个有效的基于加权FP-Tree的加权最大频繁项目集挖掘算法,其挖掘过程中不需要产生候选项目集.并通过实例说明了此算法的挖掘过程.实验结果表明此算法是有效的并且有较好的扩展性. 相似文献
3.
针对传统关联规则挖掘中可能会忽略具有时间因素的关联规则的问题,提出了一种具有时间约束的改进时态关联规则算法.该算法通过计算模式平均支持度、数据集平均支持度、模式集中度等参数来判断Apriori算法所得到的模式是否在某一时间区域数据集上具有较高支持度,再对该数据集进行进一步挖掘,以找到更精确的和时间相关的模式,从而得到单个或不同时间区间上的关联规则以及跨时间区间和跨事务的关联规则.通过实验分析,该算法是可行的,并在实际应用中有一定的意义. 相似文献
4.
在日益激烈的电子对抗中,如何从纯比特流中寻找特征模式序列是分析比特流信息的核心问题。传统的模式匹配方式虽然能够解决特定模式序列的寻找,但是对于频繁序列的发现需要耗费大量的时间和空间。面向比特流的频繁模式序列挖掘算法引入了数据挖掘的思想,解决了模式匹配要多次扫描源数据的问题,利用频繁集挖掘的剪枝方法,减少数据库操作次数,提高了频繁序列的寻找效率。 相似文献
5.
《现代电子技术》2019,(19):90-94
传统Apriori挖掘算法需多次扫描数据库、多次连接频繁项集,导致挖掘效率较低,为此对Apriori挖掘算法加以改进,设计一种新的Apriori挖掘算法用于音乐节目分类。改进的Apriori挖掘算法采用莱特准则对音频数据进行野值与噪声平滑处理,改进Apriori挖掘算法的音频数据库映射令两个线性表分别负责音频数据存储和对应项存储,音频数据库扫描次数降为一次;改进Apriori挖掘算法的连接次数无需对不具备交运算能力的元素进行交运算操作,减少频繁项集连接次数。基于改进频繁项集Apriori挖掘算法挖掘频繁项集、生成音频数据关联规则,基于关联规则集构建分类器,实现音乐节目分类。实验结果显示,改进Apriori挖掘算法用于音乐节目分类的效率优势突出,准确度高。 相似文献
6.
提出了一种基于频繁模式矩阵(FP-array)的约束最大频繁项目集挖掘及其更新算法。算法只扫描事务数据库一遍,把满足约束条件的所有事务转换成一个频繁模式矩阵,显著缩小了FP-array的大小规模。挖掘过程采用逻辑运算,在效率上有独特的优势。实验结果表明该算法是快速有效的。 相似文献
7.
8.
挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP—tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度。采用传递候选最大频繁项目集的方法。实验表明该算法是有效的并行算法。 相似文献
9.
提出了一种有效的增量式关联规则挖掘算法IAR,算法的特点在于:提出并采用了基于候选项集个数上阶的选择扫描数据库的机制,可有效减少数据库的扫描次数;算法是一种通用的增量式算法,提出了最小支持度和数据库均改变时,增量式挖掘中的重要性质,从而可充分利用上一次挖掘的结果,有效减少候选项集的数目.并且提出了基于组合数学和项集等价类理论的计算候选项集个数的上阶的方法.通过大量的数据实验,表明算法的效率比已有的算法有了很大提高. 相似文献
10.
11.
12.
CR:一种逆向的关联规则挖掘算法 总被引:4,自引:0,他引:4
引入与交易相关的有关概念,对传统关联规则挖掘的概念进行了扩展,并基于交易提出了一种关联规则挖掘算法,该算法从较长的交易入手,试图找出长的频繁项集,再确定它们的子项集,从而避免了组合爆炸问题。该算法对原数据库进行1次扫描,对压缩数据库进行了2次扫描,较Apriori算法减少了扫描次数,提高了挖掘效率。 相似文献
13.
数据挖掘是关联规则中一个重要的研究方向.对关联规则的数据挖掘和遗传算法进行概述,阐述关联规则数据挖掘的意义,提出一种采用改进型遗传算法的关联规则的提取算法,并从编码方法、适应度函数的构造和变异、选择、交叉算子设计方面进行讨论和分析,最后结合一个具体实例进行应用.实验证明这种算法是有效的. 相似文献
14.
随着信息技术和数据库技术的飞速发展,从大量的数据中获取有用的信息和知识变得越来越重要。模糊关联规则挖掘是数据挖掘中针对数量型属性关联规则发现的一种有效方法。提出了一种基于矩阵的模糊关联规则挖掘算法,并将其应用于网络安全事件关联分析中,通过对DARPA标准数据集的分析,得出了预期数量的关联规则,并成功验证了某些攻击场景,该模糊关联规则挖掘算法取得了较好的实验结果。 相似文献
15.
挖掘关联规则频繁项集的算法研究及其Prolog实现 总被引:4,自引:4,他引:0
挖掘事务库中的频繁项集是数据挖掘的重要任务之一。文章对求关联规则中频繁项集算法进行了分析,着重叙述了DHP算法的设计思想,并用Prolog语言实现,试图探讨用逻辑推理方法解决数据挖掘问题。 相似文献
16.
关联规则在电子商务推荐系统中的应用 总被引:1,自引:0,他引:1
以数据挖掘中的关联规则为基础,深入研究了基于关联规则的个性化推荐技术在电子商务中的应用,提出了电子商务推荐系统的体系结构,并对系统涉及到的关键技术进行了详细的描述.系统采用FP-Growth算法进行关联规则的挖掘,紧紧结合了数据库技术的优势,对当前电子商务系统中大量复杂的数据具有很好的适应性. 相似文献
17.
18.
一种基于云计算的关联规则Apriori算法 总被引:1,自引:0,他引:1
关联规则是数据挖掘的重要方法之一,它基于支持度和置信度等对规则进行选择,以生成有用的规则。传统的关联规则算法需要读取数据库计算频繁集,开销巨大。随着云计算的发展,MapReduce编程架构已经成为云计算中的重要技术,针对Apriori算法的不足,设计了一种算法将云计算MapReduce框架进行了适当改进,并在此基础上编写了Apriori算法,以解决Apriori算法扩展性差的弱点。实验表明:该算法能有效提高Apriori算法的性能。 相似文献