共查询到19条相似文献,搜索用时 125 毫秒
1.
多支持度关联规则在网络使用挖掘中的应用 总被引:6,自引:0,他引:6
关联规则方法是网络挖掘中一种备受人们关注的技术,但大多数方法在整体上采用统一的最少支持度,使得其在实际应用中受到限制。论文从这一问题出发,拟定了一个事务集,论述多支持度的关联规则方法。并把该方法应用到网络使用挖掘中,根据页面的出现频率确定其最少支持度阀值,发现并论证了不平衡数据项之间的有效规则。从执行时间和搜索空间上验证了算法的有效性。 相似文献
2.
3.
针对传统数据关联挖掘过程只适用于单段数据集,导致内存负担重、挖掘频繁项集效率不高等问题,提出一种多段支持度数据频繁模式关联规则挖掘方法.运用多支持度算法对数据集逐步搜索,数据集按照数据项的MIS大小有序排列,采用最小值作为最小支持度,确保该算法的地推性.构建FP_ tree树,利用FP_tree算法对待选项实施剪枝,从... 相似文献
4.
常浩 《计算机工程与设计》2012,33(8):3224-3229
为了在事务数据库中发现关联规则,在现实挖掘应用中,经常采用不同的标准去判断不同项目的重要性,管理项目之间的分类关系和处理定量数据集这3个方法去处理问题,因此提出一个在定量事务数据库中采用多最小支持度,在项目集中获取隐含知识的多层模糊关联规则挖掘算法。该挖掘算法使用两种支持度约束和至上而下逐步细化的方法推导出频繁项集,同时可以发现交叉层次的模糊关联规则。通过实例证明了该挖掘算法在多最小支持度约束下推导出的多层模糊关联规则是易于理解和有意义的,具有很好的效率和伸缩性。 相似文献
5.
6.
分组多支持度关联规则研究 总被引:4,自引:1,他引:3
宫雨 《计算机工程与设计》2007,28(5):1205-1207
关联规则是数据挖掘的重要任务之一,传统关联规则算法只有一个最小支持度,假设项出现的频率大致相同,而在谮实际中并非如此,由此产生了多支持度关联规则问题.该问题针对每个项给定不同的支持度,而在实际应用中项可以划分成若干个组,每组有一个支持度.由此提出了分组多支持度关联规则问题,针对该问题给出了基于多支持度性质对项进行分组的方法.该方法可以降低2-项候选集的数目.在此基础上,进一步给出了相应的多支持度关联规则发现算法,并通过实验证明了算法的有效性. 相似文献
7.
多最小支持度策略的关联规则挖掘方法 总被引:9,自引:0,他引:9
关联规则的数据挖掘是当今数据挖掘领域的重要内容之一 .国内现有的关联规则挖掘算法大多是在最小支持度的限定条件下 ,发现挖掘数据的各属性间的所有关联型知识 .而事实上由于基于不同数据属性的事件的发生频率是不同的 ,这样仅通过唯一的支持度限定的挖掘就无法正确反映挖掘对象本身的特征 .本文从客观事实的本质出发 ,在原有 Apriori算法的基础上 ,采用了一种多支持度的关联规则挖掘策略 .最后通过实验结果表明 ,这种挖掘方法能够更加准确和高效地进行知识挖掘 . 相似文献
8.
在多支持度关联规则挖掘算法中,针对最小支持度的选取问题,提出一种基于分段函数的多支持度关联规则挖掘算法.在多支持度算法中挖掘频繁集的时候,最小支持度由项集最小项支持度的最小值、最大值和给定的参考值所决定,这样避免了采用最小值作为最小支持度算法的时间复杂度高和存在无效规则的问题,以及采用最大值致使剪枝程度过大而造成规则遗漏的问题.通过实验结果表明了该算法的有效性. 相似文献
9.
首先分析传统用在挖掘结构化数据关联规则的基本思想,然后分析图像数据的特征,找出图像数据与传统结构化数据的区别,最后结合图像数据的特性将传统的关联规则进行改进,并将它应用在图像数据挖掘中,挖掘出图像数据的相关性. 相似文献
10.
针对数据集中交易记录和数据项的重要性不同问题,提出了一种多最小支持度的加权关联规则挖掘算法,允许用户设定多个最小支持度,给出交易记录不同的权重,从而发现有价值的关联规则。该算法按项目的最小支持度升序对交易记录进行分类,按类别依次求出每一类别内的加权频繁集。在挖掘过程中由于剔除了冗余项目并对相同项集累加计数,且不需多次重复扫描数据库,从而提高了挖掘效率。实验结果表明,新算法能有效地从数据集中挖掘出加权关联规则。 相似文献
11.
基于关联规则数据挖掘技术在数据仓库中的应用 总被引:2,自引:0,他引:2
介绍了关联规则的基本概念,以及关联规则的种类和核心算法。详细说明了多层关联规则的主要内容,结合实际数据在数据仓库和数据挖掘中的处理过程,讨论了关联规则在科学数据库系统中的应用。最后介绍了多维关联规则挖掘技术的基本概念和关键问题的处理方法。 相似文献
12.
一种基于约束的关联规则挖掘算法 总被引:1,自引:1,他引:0
基于约束的关联规则挖掘是一种重要的关联挖掘,能按照用户给出的条件来实行有针对性的挖掘。大多数此类算法仅处理具有一种约束的挖掘,因而其应用受到一定程度的限制。提出一种新的基于约束的关联规则挖掘算法MCAL,它同时处理两种类型的约束:非单调性约束和单调性约束。算法包括3个步骤:第一步,挖掘当前数据集的频繁1项集;第二,应用约束的性质和有效剪枝策略来寻找约束点,同时生成频繁项的条件数据库;最后,递归地应用前面两步寻找条件数据库中频繁项的约束点,以生成满足约束的全部频繁项集。通过实验对比,无论从运行时间还是可扩展性来说,本算法均达到较好的效果。 相似文献
13.
关联规则在空间数据挖掘中的研究 总被引:2,自引:0,他引:2
在智能化、集成化的空间数据应用领域中,空间数据挖掘是一门很重要的技术,而关联规则分析是空间数据挖掘的主要方法之一。文章基于数据挖掘中的关联规则分析方法,提出不同于一般数据挖掘的算法,设定兴趣度量,并通过将项的概念泛化为空间谓词,事务的概念泛化为邻域,关联规则的概念泛化为同位规则,发现多种形式的有效规则,并用逻辑语言或类SQL语言方式描述规则,以使空间数据挖掘趋于规范化和工程化。最后进行了实评。 相似文献
14.
基于关联规则的数据挖掘技术的快速算法 总被引:12,自引:1,他引:11
提出了一种改进的Apriori算法的数据挖掘模式,探讨了对其中的生成候选频繁项目集、生成强关联规则等几个关健步骤运用标准SQL语言的算法实现。 相似文献
15.
针对Apriori算法及ML-T2算法在应用时会造成规则遗失的问题,文章对关联规则进行了研究,并提供了可行的解决方案。其一为不改变原算法从顶到底的思想,充分利用预先设置的minSup值,通过在高层上预存可能会在底层上构成候选大项集的项集来保证有用规则的完全提取;其二则采用从底到顶的思想,运用不产生候选大项集方法,并把它扩展到由底层到顶层的各层建立各自的FP树,这样也不会造成有用规则的丢失。 相似文献
16.
数据挖掘是从大量不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的,事先不为人知的,但又潜在的有用的信息和知识的过程.使用一种挖掘算法,用簇集表格来存储数据库中的项目,利用最大值约束下的多最小支持度挖掘算法综合以得出关联规则. 相似文献
17.
一种改进的关联规则挖掘算法 总被引:9,自引:0,他引:9
目前,已经提出了许多挖掘关联规则的算法,其中最著名的是Apriori算法及其变型。这些传统的算法大多存在项集生成瓶颈和难以确定合适的支持度阈值的问题,并且没有考虑数据库的被分析项的各自不同的重要性。为了解决这些问题,该文提出了一种新的关联挖掘算法。 相似文献
18.