首页 | 本学科首页   官方微博 | 高级检索  
     

一个高效的关联规则挖掘算法
引用本文:柴玉梅,李梅花.一个高效的关联规则挖掘算法[J].计算机工程与应用,2006,42(10):172-174.
作者姓名:柴玉梅  李梅花
作者单位:郑州大学信息工程学院,郑州,450052
摘    要:运用抽样和动态项集计数的思想,提出了一个仅对数据库进行一遍扫描的关联规则挖掘算法DS。DS首先在数据库上随机得到一个样本集,然后在样本集上使用动态项集计数方法得到数据库的估计频繁项,之后通过对数据库中的非样本事务进行一遍扫描得到这些项的实际计数,进而得到数据库的频繁项集。实验证明,DS算法极大地提高了挖掘的效率。

关 键 词:关联规则  抽样  动态计数  负边界
文章编号:1002-8331-(2006)10-0172-03
收稿时间:2005-09-01
修稿时间:2005-09-01

A High-performance Algorithm for Mining Association Rules
Chai Yumei,Li Meihua.A High-performance Algorithm for Mining Association Rules[J].Computer Engineering and Applications,2006,42(10):172-174.
Authors:Chai Yumei  Li Meihua
Affiliation:College of Information Engineering,Zhengzhou University,Zhengzhou 450052
Abstract:In this paper,we present a new association rule mining(ARM) algorithm of DS that will scan the whole database only once.DS applies the idea of sampling.At first,it draws a random sample S from database,then gets the estimated frequency itemsets by dynamic itemset counting on S.Finally the estimated frequency itemsets are validated in a single scan on the odd database.Experiments over standard synthetic datasets demonstrate that DS improves the efficiency of the mining greatly.
Keywords:association rule  sample  dynamic itemset counting  negative border
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号