首页 | 本学科首页   官方微博 | 高级检索  
     

基于链表数组的最大频繁项集挖掘算法
引用本文:刘应东,冷明伟,陈晓云.基于链表数组的最大频繁项集挖掘算法[J].计算机工程,2010,36(6):89-90.
作者姓名:刘应东  冷明伟  陈晓云
作者单位:1. 兰州交通大学交通运输学院,兰州,730070
2. 上饶师范学院数学与计算机系,上饶,334000
3. 兰州大学信息科学与工程学院,兰州,730000
基金项目:江西省教育厅青年科学基金资助项目(GJJ09616);;江西省教育厅科技课题基金资助项目(GJJ09377)
摘    要:挖掘密集型数据集的全部频繁项集代价高昂,针对该问题,提出一种数据结构链表数组和基于链表数组的最大频繁项集快速生成算法。该方法使用链表数组为每个项目建立事务链表,并且链表的创建过程只需扫描数据库1次。使用深度优先搜索得到所有候选最大频繁项集,利用约束条件缩小搜索空间。使用标准数据集进行验证测试并与其他算法进行比较,实验结果表明,该算法具有较快的挖掘速度。

关 键 词:数据挖掘  最大频繁项集  链表数组  解空间
修稿时间: 

Maximal Frequent Itemsets Mining Algorithm Based on Linked List Array
LIU Ying-dong,LENG Ming-wei,CHEN Xiao-yun.Maximal Frequent Itemsets Mining Algorithm Based on Linked List Array[J].Computer Engineering,2010,36(6):89-90.
Authors:LIU Ying-dong  LENG Ming-wei  CHEN Xiao-yun
Affiliation:(1. School of Traffic and Transportation, Lanzhou Jiaotong University, Lanzhou 730070; 2. Department of Mathematics and Computer, Shangrao Normal University, Shangrao 334000; 3. School of Information Science and Engineering, Lanzhou University, Lanzhou 730000)
Abstract:Mining all frequent itemsets in dense datasets is very expensive. Aiming at this problem, linked list array, a new data structure, and a fast method of Mining Frequent Itemsets(MFI) based on it are proposed. This method creates linked list array for each item, only needs scan database one time, uses depth-first search strategy to generate all MFI. The algorithm reduces search space by using constraint condition. It demonstrates the algorithm with standard dataset, and the experimental results confirm that the mining algorithm can significantly improve the speed of mining MFI compared with other algorithms.
Keywords:data mining  Maximal Frequent Itemsets(MFI)  linked list array  solution space
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号