首页 | 本学科首页   官方微博 | 高级检索  
     

一种开采频繁项目集集合的快速算法
引用本文:赵栋,卢炎生.一种开采频繁项目集集合的快速算法[J].计算机工程与科学,2005,27(10):53-54.
作者姓名:赵栋  卢炎生
作者单位:华中科技大学计算机科学与技术学院,湖北,武汉,430074
基金项目:“十五”国家科技攻关计划资助项目(2001BA102A04-02-03)
摘    要:在大的数据集合中,开采其中的频繁项目集集合是数据挖掘中极具挑战的重要任务。已经有很多高效的算法被总结了出来。本文提出了一种思想,即开采频繁项目集集合的一 个子集,我们称之为频繁无析取规则集集合,而并非开采完全的频繁项目集集合。我们证明能借助它不读取数据库而还原出频繁项目集集合的全集和它们的支持度。本文还提 提出了一个开采无析取规则集集合的算法HOPE-Ⅱ,实验结果显示了其高效性。我们将它与另一种称为频繁封闭集的精简集进行对比,几乎所有的实验结果都显示使用无析取规则集集合比使用封闭集集合来开采频繁项目集集合更有效。

关 键 词:数据挖掘  精简集  频繁项目集
文章编号:1007-130X(2005)10-0053-02
修稿时间:2003年12月11

An Efficient Algorithm for Mining Frequent Itemsets
ZHAO Dong,LU Yan-Sheng.An Efficient Algorithm for Mining Frequent Itemsets[J].Computer Engineering & Science,2005,27(10):53-54.
Authors:ZHAO Dong  LU Yan-Sheng
Abstract:Given a large set of data,extracting frequent itemsets in this set is a challenging job in data mining.Many efficient algorithms have been proposed in the literature.The idea presented in this paper is to extract a condensed representation of the frequent itemsets called disjunction-free sets,instead of extracting the whole frequent itemsets collection.We show that this condensed representation can be used to regenerate all frequent itemsets and their exact frequencies without any access to the original data.An algorithm,HOPE-II,is presented to extract the frequent disjunction-free sets and practical experiments show that this representation can be extracted very efficiently.We compare it with another representation in the literature called frequent closed sets,and in nearly all the experiments we have done,the disjunction-free sets have been extracted much more efficiently than the frequent closed sets.
Keywords:data mining  condensed representation  frequent itemset  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号