首页 | 本学科首页   官方微博 | 高级检索  
     

一种不产生候选项挖掘频繁项集的新算法
引用本文:周焕银,张永,蔺鹏. 一种不产生候选项挖掘频繁项集的新算法[J]. 计算机工程与应用, 2004, 40(15): 182-185
作者姓名:周焕银  张永  蔺鹏
作者单位:兰州理工大学电信学院,兰州,730050;兰州理工大学电信学院,兰州,730050;兰州理工大学电信学院,兰州,730050
摘    要:Apriori算法是关联规则挖掘算法中应用最为广泛的一种算法,它的主要目的是从大量的事务数据中通过候选项集挖掘出有趣的频繁项集,从而为用户提供有意义的关联关系。但随着数据库规模的扩大,apriori算法可能会产生如下两大棘手问题:大量候选项集的产生将造成巨大计算量的浪费;为剪掉无用候选项如何设置阈值。这些问题相对于众多普通用户来说都具有挑战性。该文提出的代码与运算是一种无须候选项挖掘频繁项集的算法,用户无须为设置阈值而煞费苦心。同时事务压缩算法的加入大大减少了算法中的计算量。

关 键 词:关联规则挖掘  apriori算法  代码与运算  事务压缩
文章编号:1002-8331-(2004)15-0182-04

One Algorithm for Discovering Frequent Itemsets without Candidate Generations
Zhou Huanyin Zhang Yong Lin Peng. One Algorithm for Discovering Frequent Itemsets without Candidate Generations[J]. Computer Engineering and Applications, 2004, 40(15): 182-185
Authors:Zhou Huanyin Zhang Yong Lin Peng
Abstract:This paper gives an efficient algorithm for association rule mining,namely And Code(AC)algorithm.AC algo-rithm can discover all frequent itemsets from transaction database quickly without candidate generations.Compared with apriori algorithm,it avoids great amounts of candidates and some exact or experienced thresholds for these candidates.The steps of AC algorithm is:firstly it makes one corresponding code for every itemset according to coding rules after transaction reduction,Secondly it runs And algorithm for itemset codes so as to achieve all frequent itemset codes,Last step will transform these codes into corresponding itemsets,then these itemsets can be classed into frequent itemsets according to the support thresholds of frequent itemsets.
Keywords:association rules  apriori algorithm  And Code algorithm  transaction reduction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号