首页 | 本学科首页   官方微博 | 高级检索  
     

基于云计算的Web数据挖掘
引用本文:程苗.基于云计算的Web数据挖掘[J].计算机科学,2011(Z1).
作者姓名:程苗
作者单位:中国科学技术大学管理学院;
基金项目:博士点基金项目(200803580024); 创新研究群体科学基金(70821001)资助
摘    要:因特网是一个巨大的、分布广泛的信息服务中心,其上产生的海量数据通常是地理上分布、异构、动态的,复杂性也越来越高,若用已有的集中式数据挖掘方法则不能满足应用的要求。为了解决这些问题,提出了一种基于云计算的Web数据挖掘方法:将海量数据和挖掘任务分解到多台服务器上并行处理。采用Hadoop开源平台,建立一个基于Apriori算法的并行关联规则挖掘算法来验证了该系统的高效性。还提出计算向存储迁移的设计思想,将计算在数据存储节点就地执行,从而避免了大量数据在网络上的传递,不会占用大量带宽。

关 键 词:云计算  数据挖掘  Map/Reduce  关联规则  

Web Data Mining Based on Cloud-computing
CHENG Miao.Web Data Mining Based on Cloud-computing[J].Computer Science,2011(Z1).
Authors:CHENG Miao
Affiliation:CHENG Miao(School of Management,University of Science and Technology of China,Hefei 230026,China)
Abstract:
Keywords:Cloud-computing  Data mining  Map/Reduce  Association rules  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号