首页 | 本学科首页   官方微博 | 高级检索  
     

频繁项集挖掘的研究与进展
引用本文:陈慧萍,王建东,王煜.频繁项集挖掘的研究与进展[J].计算机仿真,2006,23(4):68-73.
作者姓名:陈慧萍  王建东  王煜
作者单位:1. 河海大学计算机信息工程学院,江苏,常州,213022;南京航空航天大学信息科学与技术学院,江苏,南京,210016
2. 南京航空航天大学信息科学与技术学院,江苏,南京,210016
3. 河海大学计算机信息工程学院,江苏,常州,213022
基金项目:科技部科研项目;江苏省自然科学基金
摘    要:挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,所以提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。该文从频繁项集生成过程中解空间的类型、搜索方法和剪枝策略、数据库的表示方法、数据压缩技术等几个方面对频繁项集挖掘的基本策略进行了研究,对完全频繁项集挖掘、频繁闭项集挖掘和最大频繁项集挖掘的典型算法特别是最新算法进行了介绍和评述,并分析了各种算法的性能特点,指出其适于哪种类型的数据集。最后,对频繁项集挖掘算法的发展方向进行了初步的探讨。

关 键 词:数据挖掘  频繁项集  搜索方法  剪枝策略
文章编号:1006-9348(2006)04-0068-06
收稿时间:2004-12-21
修稿时间:2004年12月21

Research and Advances of Frequent Itemsets Mining
CHEN Hui-ping,WANG Jian-dong,WANG Yu.Research and Advances of Frequent Itemsets Mining[J].Computer Simulation,2006,23(4):68-73.
Authors:CHEN Hui-ping  WANG Jian-dong  WANG Yu
Affiliation:1. College of Information Science and Technology, Hohai University, Changzhou Jiangsu 213022, China; 2. College of Computer and Information, Nanjing University of Aeronautics and Austrautics, Nanjing Jiangsu 210016,China
Abstract:Mining the frequent itemsets is a key problem in data mining. It is also the core of the algorithm for mining association rules. Therefore, to improve the efficiency of discovering the frequent itemsets is the issue in data mining area. Many researchers have done lots of work to improve the algorithms from different perspectives. In this paper, we present an overview of the basic strategies for mining the frequent itemsets from different aspects such as the types of search space, search methods and pruning strategies, the representation methods of the databases, data compression techniques. Some representative algorithms, especially new algorithms in all frequent itemsets, frequent closed itemsets and maximal frequent itemsets are introduced and commented. We analyze the performance of these algorithms and point out which kind of datasets the algorithm fit for. At last, the future directions of the algorithms for mining frequent itemsets are discussed.
Keywords:Data mining  Frequent itemsets  Search method  Pruning strategy
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号