基于MapReduce计算模型的并行关联规则挖掘算法研究综述 |
| |
作者姓名: | 肖文 胡娟 周晓峰 |
| |
作者单位: | 河海大学文天学院 电气信息工程系,河海大学文天学院 电气信息工程系,河海大学 计算机与信息学院 |
| |
摘 要: | 关联规则挖掘是最常用、最重要的数据挖掘任务之一,经典的关联规则挖掘算法有Apriori、FP-Growth、Eclat等。随着数据的爆炸式增长,传统的算法已不能适应大数据挖掘的需要,需要分布式、并行的关联规则挖掘算法来解决上述问题。MapReduce是一种流行的分布式并行计算模型,因其使用简单、伸缩性好、自动负载均衡和自动容错等优点,得到了广泛的应用。本文对已有的基于MapReduce计算模型的并行关联规则挖掘算法进行了分类和综述,对其各自的优缺点和适用范围进行了总结,并对下一步的研究进行了展望。
|
关 键 词: | 数据挖掘 关联规则挖掘 频繁项集 并行 MapReduce Hadoop |
收稿时间: | 2016-12-13 |
修稿时间: | 2017-11-14 |
|
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|