首页 | 本学科首页   官方微博 | 高级检索  
     

一种分布环境中最大频繁项目集挖掘算法
引用本文:李忠哗,何丕廉.一种分布环境中最大频繁项目集挖掘算法[J].微电子学与计算机,2006,23(9):162-164.
作者姓名:李忠哗  何丕廉
作者单位:1. 河北北方学院计算机系,河北,张家口,075000;天津大学计算机学院,天津,300072
2. 天津大学计算机学院,天津,300072
基金项目:天津市科技发展基金;天津市应用基础研究项目
摘    要:挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP—tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度。采用传递候选最大频繁项目集的方法。实验表明该算法是有效的并行算法。

关 键 词:分布数据库  数据挖掘  最大频繁项目集  频繁模式树
文章编号:1000-7180(2006)09-0162-02
收稿时间:2006-04-28

Algorithm of Mining Maximum Frequent Pattern in Distributed Environment
LI Zhong-hua,HE Pi-lian.Algorithm of Mining Maximum Frequent Pattern in Distributed Environment[J].Microelectronics & Computer,2006,23(9):162-164.
Authors:LI Zhong-hua  HE Pi-lian
Affiliation:1 Department of Computer Science, Hebei North University, Zhangjiakou 075000 China; 2 Department of Computer, Tianjin University, Tianjin 300072
Abstract:Mining maximum frequent itemsets is a key problem in data mining research.There are many algorithms of Mining maximum frequent itemsets based on local databases.Very little work has been done in distributed databases.Therefore,algorithm of mining maximum frequent itemsets in distributed databases is proposed.It attempts to make each processor to do independently.It adopts frequent pattern tree(FP-tree).It can mine locally maximum frequent itemsets easily from locally FP-tree and count support of each pattern easily.It transmits candidate pattern.Experimental results show that the algorithm is effective parallel algorithm.
Keywords:Distribute database  Data mining  Maximum frequent itemsets  Frequent pattern tree
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号