期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

喻斌武友新《计算机工程与设计》2007,28(20):4853-4855

频繁模式增长算法是一种不产生候选频繁项集的关联规则挖掘算法.利用哈希表来存储数据库中事务信息,可以减少对数据库的扫描次数,从而得到一种更优的快速频繁模式树生成算法,即OFP-tree算法.举例说明了该算法的执行过程并对该算法进行了分析和改进,最后阐述了该算法相对于传统频繁模式树生成算法的优越性. 相似文献

2.

基于哈希的B+树结构的频繁模式挖掘

叶飞跃《计算机工程》2004,30(13):113-115

提出了一种基干改进的B 树结构及一种新的数据挖掘算法,HB-Minc,该算法通过构造哈希函数,获得B 树的关键字,并在B 树的叶子结点上构建链表结构,记录卡H关关键字的项集及频数,这样在无需产生巨大的候选项集的情况下,挖掘出频繁模式,且具有较高的时间效率。相似文献

3.

基于哈希链结构的频繁模式挖掘 总被引：5，自引：0，他引：5

叶飞跃王建东陈慧萍张有东《计算机工程与应用》2004,40(11):174-176,194

研究工作者已经提出了一些频繁模式的挖掘算法,然而,已经提出的各种算法在不同的挖掘条件下,仍然存在一些不足之处。该文提出了一种改进的哈希链地址结构及一种新的数据挖掘算法,HCS-Mine,该算法采用哈希链结构,无需产生巨大的候选项集,且简单高效。相似文献

4.

挖掘数据库中的负频繁模式

袁本刚陈莉金燕《计算机工程与应用》2010,46(8):117-119

传统的关联规则挖掘研究事务中所包含的项与项之间的关联性,而负关联规则挖掘不仅要考虑事务中包含的项,还要考虑事务中不包含的项。给出了完全负关联规则的定义,提出一种基于树的算法Free-PNP,通过此算法挖掘数据库中的负频繁模式,继而得到所要挖掘的完全负关联规则。通过实验验证了算法的有效性。相似文献

5.

基于FP-参考树／表的频繁模式挖掘算法

石巍傅彦《计算机科学》2006,33(6):206-209

通分析FP-growth算法中包含的冗余操作,引入数据结构FP参考树／表,改变FPgrowth算法中条件模式基的存储和生成方式,提出了新的FPRSG算法,高效地解决了频繁模式挖掘问题。理论分析与实验结果表明,FPRSG算法优于FPgrowth算法。相似文献

6.

基于FP-tree的最大频繁模式挖掘算法 总被引：11，自引：0，他引：11

冯志新钟诚《计算机工程》2004,30(11):123-124

在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明．算法FP-Max在挖掘密集型数据集方面是高效的。相似文献

7.

基于树搜索方式的频繁模式挖掘综述

潘立福朱利晶敖富江杜静《计算机与信息技术》2009,(5)

在所有数据挖掘任务中,关联规则挖掘是一种非常重要的挖掘任务。而频繁模式挖掘是关联规则挖掘的关键步骤。其中,基于树搜索方式的挖掘方法是频繁模式挖掘的主要方法。本文综述了该方法所使用的搜索空间树、搜索方式和剪枝技术,对开发基于树搜索方式的频繁模式挖掘算法具有重要意义。相似文献

8.

一种高效的频繁模式挖掘算法

曾艳麦永浩《计算机应用》2004,24(8):57-60

在分析研究具有代表性的关联知识挖掘算法的基础上,提出了挖掘频繁模式的一个新的数据库存储结构AFP-树,并在此结构上设计了一个频繁模式挖掘算法。理论研究已经阐明了AFP-树的有效性和相关算法的高效性。相似文献

9.

基于频繁模式树的负关联规则挖掘算法 总被引：1，自引：0，他引：1

朱玉全孙蕾杨鹤标宋余庆《计算机工程》2006,32(22):51-52,6

典型的正关联规则仅考虑事务中所列举的项目。负关联规则不但要考虑事务中所包含的项目集,还必需考虑事务中所不包含的项目,它包含了非常有价值的信息。然而,对于负关联规则的研究却很少,仅有的几种算法也存在一定的局限性。为此,该文提出了一种基于FP-tree的负关联规则挖掘算法,该算法不但可以发现事务数据库中所有的负关联规则,而且整个过程只需扫描事务数据库两次,算法是有效和可行的。相似文献

10.

频繁项集挖掘中的两种哈希树构建方法 总被引：1，自引：0，他引：1

杜孝平罗宪唐世渭《计算机科学》2002,29(12):138-140

1 引言从大型数据库中发现频繁项集/模式的研究作为关联规则、序贯模式、因果关系、最大模式、多维模式等挖掘问题的核心,已经成为近年数据挖掘领域的研究热点,并有不少有效的挖掘算法被提出。在这些挖掘算法中,它们大多数都采用了类似于Apriori算法的方法进行频繁项集的挖掘与更新。类Apriori算法的共同特点是:为了找出库中所有包含k(k>1)个项的频繁k-项集,首先产生包含频相似文献

11.

基于节点表的FP-Growth算法改进

王建明袁伟《计算机工程与设计》2018,(1):140-145

针对FP-Growth算法在构建FP-tree过程中需要对事务数据库扫描两次,同时在利用FP-tree挖掘频繁项集过程中产生大量条件模式基和条件模式树的问题,提出一种改进的FP-Growth算法。该算法只需扫描一次事务数据库,就能构建一棵无相同节点的新的FP-tree;弃用项头表,新增与新的FP-tree关联的节点表,将构建新的FP-tree过程中"多余"的项信息存入节点表;利用新的FP-tree和节点表挖掘频繁项集。实验结果表明了该算法的可行性和有效性,其提高了数据挖掘的效率。相似文献

12.

Efficient Mining of Frequent Patterns Using Ascending Frequency Ordered Prefix-Tree 总被引：2，自引：0，他引：2

Guimei Liu Hongjun Lu Wenwu Lou Yabo Xu Jeffrey Xu Yu 《Data mining and knowledge discovery》2004,9(3):249-274

Mining frequent patterns, including mining frequent closed patterns or maximal patterns, is a fundamental and important problem in data mining area. Many algorithms adopt the pattern growth approach, which is shown to be superior to the candidate generate-and-test approach, especially when long patterns exist in the datasets. In this paper, we identify the key factors that influence the performance of the pattern growth approach, and optimize them to further improve the performance. Our algorithm uses a simple while compact data structure—ascending frequency ordered prefix-tree (AFOPT) to store the conditional databases, in which we use arrays to store single branches to further save space. The AFOPT structure is traversed in top-down depth-first order. Our analysis and experiment results show that the combination of the top-down traversal strategy and the ascending frequency order achieves significant performance improvement over previous works. 相似文献

13.

无项头表的FP-Growth算法

凌绪雄王社国李洋苗再良《计算机应用》2011,31(5):1391-1394

针对FP-Growth算法中频繁模式树的遍历低效问题,提出了一种无项头表的频繁模式增长算法。该算法利用递归回溯的方式遍历频繁模式树以求取条件模式基,解决了对同一树路径多次重复遍历的问题。从理论分析和实际挖掘能力两方面,将新算法与FP-Growth算法进行了对比。结果表明,新算法有效减少了条件模式基的搜索开销,使频繁模式挖掘的效率提高了2~5倍,在时间和空间性能上均优于FP-Growth算法。将该算法应用于通信告警关联规则挖掘,较快地挖掘出了关联规则结果,且正确规则的覆盖率达到了83.3%。相似文献

14.

关联规则挖掘研究综述

武瑞娟马礼叶树华《电脑开发与应用》2008,21(3):46-49

关联规则挖掘是近年来数据挖掘研究中一个非常活跃的领域,给出了关联规则及相关术语的定义,对关联规则挖掘中的频繁模式、频繁闭模式及并行／分布式挖掘作了阐述,着重介绍了近几年来发表的一些新算法,并对未来的发展趋势进行了预测和展望。相似文献

15.

频繁模式挖掘进展及典型应用 总被引：1，自引：0，他引：1

马青霞李广水孙梅《计算机工程与应用》2011,47(15):138-144

对近年来频繁模式的挖掘进行了总结。首先对有代表性的挖掘算法从算法思想、关键技术、算法的优缺点进行了分析概括,此后列举了一些典型频繁模式及关联规则的领域应用。综述内容的选择主要基于某一个研究后续被关注程度,组织过程中力争将相关研究进行归类,以给出其发展概貌。上述工作可以为频繁模式挖掘及关联规则的研究提供有益的参考。相似文献

16.

一种无阈值的频繁模式生成算法

神鹏飞王希武耿志广王创伟李国良《计算机工程》2011,37(8):31-33

在数据挖掘的关联规则挖掘算法中,传统的频繁模式挖掘算法需要用户指定项集的最小支持度。引入Top-k模式挖掘概念的改进算法虽然无需指定最小支持度,但仍需指定阈值k。针对上述问题,对传统挖掘算法进行改进,提出一种新的频繁模式挖掘算法(TNFP- growth)。该算法无需指定最小支持度或阈值,按照支持度降序排列进行模式挖掘,有序地返回频繁模式给用户。实验结果证明,该算法的执行效率更高,具有更强的伸缩性。相似文献

17.

一种含负项目的一般化关联规则挖掘算法 总被引：3，自引：0，他引：3

张玉芳彭燕刘君陈铭灏《计算机工程与设计》2006,27(20):3904-3908,3934

传统的关联规则是形如A→B反映正项目之间关联关系的蕴涵式,它无法反映出数据之间隐藏的负关联关系.在表达式中引入负项目,将这种传统的关联规则扩展成包含正、负项目的一般化关联规则.介绍了一般化关联规则的概念及其相关性质定理,并加以证明,提出了一种基于频繁模式树的挖掘混合正、负项目的一般化关联规则的MGPNFP算法,对其性能进行了分析,并比较了MGPNFP算法比现有的挖掘含负项目关联规则的算法所具有的优势. 相似文献

18.

基于Spark的并行FP-Growth算法优化及实现

顾军华武君艳许馨匀谢志坚张素琪《计算机应用》2018,38(11):3069-3074

为了进一步提高在Spark平台上的频繁模式增长（FP-Growth）算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树（FP-Tree）规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然后,通过创建列表P-List对数据集划分策略进行优化,减少遍历次数,降低时间复杂度。实验结果表明,BFPG算法提高了并行FP-Growth算法挖掘效率,且算法具有良好的扩展性。相似文献

19.

利用Hash树生成频繁项目集的新方法

吉根林赵斌孙志挥《小型微型计算机系统》2004,25(10):1841-1843

频繁项目集的生成是关联规则挖掘中的关键问题 .提出基于 Hash树的频繁项目集生成新方法 ,探讨了 Hash树中候选项目集的数据组织与建立算法 ,提出了利用 Hash树计算候选项目集支持数的算法 ,并用 Java语言实现了该算法 ,最后通过实验验证了利用 Hash树生成频繁项目集的有效性相似文献