基于位运算与海明距离的Apriori算法改进 |
| |
引用本文: | 王晓龙. 基于位运算与海明距离的Apriori算法改进[J]. 信息技术, 2014, 0(5): 147-150,153 |
| |
作者姓名: | 王晓龙 |
| |
作者单位: | 天津大学; |
| |
摘 要: | ![]() 关联规则现在已成为数据挖掘领域中非常重要的研究课题,用于发现隐藏在大型数据集中的令人感兴趣的联系。Apriori算法作为第一个关联规则挖掘算法,开创性地使用了基于支持度的剪枝技术,系统地控制了候选项集的指数增长。但是,Apriori算法仍然存在着频繁扫描数据库和产生大量候选项集的缺点。鉴于此,提出了用一个整型或整型数组来代替一项事务集和一项候选项集,通过数据压缩,可以一次性将海量数据载入内存,减少了磁盘I/O负载,并通过位运算与计算海明距离达到计算支持度的目的,同时使用了若干优化方法。
|
关 键 词: | Apriori 位运算 海明距离 支持度 |
Improvement of Apriori algorithm based on bit operation and Hamming distance |
| |
Abstract: | ![]()
|
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
|