分布式频繁项集挖掘算法 A DISTRIBUTED FREQUENT ITEMSET MINING ALGORITHM期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

分布式频繁项集挖掘算法

作者单位：	;1.上海市公安局科技处

摘要：	传统的频繁项集挖掘方法具有一定的局限性。Apriori算法需要重复扫描输入数据,导致很高的I/O负载,算法性能不高;Fp-growth算法需要在内存中建立Fp-tree并根据Fp-tree挖掘频繁项集,导致算法受到计算机的内存限制。在大数据时代,由于挖掘数据规模十分巨大,更加凸显这些传统算法的局限性。对此,一方面改进传统的频繁项集挖掘算法,另一方面基于Spark框架实现分布式频繁项集挖掘算法(FIMBS)。实验结果表明,该算法相比基于MapReduce框架的关联规则算法具有显著的优势。
关键词：	频繁项集挖掘分布式算法 Spark MapReduce
A DISTRIBUTED FREQUENT ITEMSET MINING ALGORITHM

Abstract:

Keywords:
本文献已被万方数据等数据库收录！