首页 | 本学科首页   官方微博 | 高级检索  
     

基于分布数据库的快速关联规则挖掘算法
引用本文:陈耿,倪巍伟,朱玉全,孙志挥.基于分布数据库的快速关联规则挖掘算法[J].计算机工程与应用,2006,42(4):165-167,194.
作者姓名:陈耿  倪巍伟  朱玉全  孙志挥
作者单位:1. 南京审计学院,南京,210029;东南大学计算机科学与工程系,南京,210096
2. 东南大学计算机科学与工程系,南京,210096
3. 江苏大学计算机科学与通信工程学院,江苏,镇江,212013
基金项目:中国科学院资助项目;江苏大学校科研和教改项目
摘    要:关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。

关 键 词:频繁项目集  分布式关联规则挖掘  数据挖掘  布尔关联规则
文章编号:1002-8331-(2006)04-0165-03
收稿时间:2005-09
修稿时间:2005-09

A Fast Algorithm for Mining Association Rules in Distributed Databases
Chen Geng,Ni Weiwei,Zhu Yuquan,Sun Zhihui.A Fast Algorithm for Mining Association Rules in Distributed Databases[J].Computer Engineering and Applications,2006,42(4):165-167,194.
Authors:Chen Geng  Ni Weiwei  Zhu Yuquan  Sun Zhihui
Affiliation:1.Nanjing Audit Nuniversity, Nanjing 210029; 2.Department of Computer and Engineering, Southeast University, Nanjing 210096; 3.School of Computer Science and Communication Engineering,Jiangsu University,Zhenjiang, Jiangsu 212013
Abstract:Association rule mining is an important issue in data mining.Distributed association mining is an effective method to solve the problem of association mining in large data set.The time complexity of association rule mining in distributed databases mainly focuses in the following aspects:(1)the generation of the frequent itemsets;(2)the communication consuming among each nodes.The article proposes a method to generate candidate frequent itemsets and corresponding supporting counts efficiently,which needs only some operations such as"and","or"and"xor".Applying this idea in the existed distributed association rule mining algorithm DMA,the improved algorithm FDMA is proposed.The theoretical analysis and experiment testify that FDMA is effective and efficient.
Keywords:frequent itemsets  distributed association rules mining  data mining  boolean association rules
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号