大数据环境下基于Hadoop框架的改进Apriori挖掘算法(英文) |
| |
引用本文: | 曾毅,周湘贞.大数据环境下基于Hadoop框架的改进Apriori挖掘算法(英文)[J].机床与液压,2019(6). |
| |
作者姓名: | 曾毅 周湘贞 |
| |
作者单位: | 广西大学行健文理学院理工学部计算机与信息工程系;中国社会科学院 |
| |
摘 要: | 针对Hadoop框架下的用户行为大数据挖掘效率问题,提出了一种改进的关联规则Apriori挖掘算法。该算法首先实现了Hadoop框架下的项集分类建模。然后通过传统关联规则Apriori算法的挖掘步骤分析,对候选项目集的生成方式进行了改进,并结合标志位信息实现无用事务去除,有效压缩了事务和项目的数量,从而缩短了任务处理时间。在具体实现过程中对改进Apriori算法流程进行了Map Reduce处理。仿真实验表明:相比于传统Apriori算法,改进后的Apriori挖掘算法具有更高的执行效率。
|
本文献已被 CNKI 等数据库收录! |
|