首页 | 本学科首页   官方微博 | 高级检索  
     

大数据环境下基于Hadoop框架的改进Apriori挖掘算法(英文)
引用本文:曾毅,周湘贞.大数据环境下基于Hadoop框架的改进Apriori挖掘算法(英文)[J].机床与液压,2019(6).
作者姓名:曾毅  周湘贞
作者单位:广西大学行健文理学院理工学部计算机与信息工程系;中国社会科学院
摘    要:针对Hadoop框架下的用户行为大数据挖掘效率问题,提出了一种改进的关联规则Apriori挖掘算法。该算法首先实现了Hadoop框架下的项集分类建模。然后通过传统关联规则Apriori算法的挖掘步骤分析,对候选项目集的生成方式进行了改进,并结合标志位信息实现无用事务去除,有效压缩了事务和项目的数量,从而缩短了任务处理时间。在具体实现过程中对改进Apriori算法流程进行了Map Reduce处理。仿真实验表明:相比于传统Apriori算法,改进后的Apriori挖掘算法具有更高的执行效率。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号