首页 | 本学科首页   官方微博 | 高级检索  
     

基于Nutch的分布式文件系统研究
引用本文:韩忠军.基于Nutch的分布式文件系统研究[J].煤炭技术,2010,29(5).
作者姓名:韩忠军
作者单位:郑州航空工业管理学院,郑州,450015
摘    要:成功的搜索引擎都有稳定的分布式文件系统,采用分布式计算的方式,使得网页数据、索引文件都分散存储在网络中,检索从分散的数据中通过分布式计算获取。通过分析分布式搜索引擎,研究了Google的分布式文件系统GoogleFS以及Map Reduce算法,针对Nutch的特性,提出了FoundClear算法和一种NDFS的解决方案,最后与GoogleFS系统作了比较。

关 键 词:搜索引擎  分布式  文件系统

Research of Distributed File System on Nutch
HAN Zhong-jun.Research of Distributed File System on Nutch[J].Coal Technology,2010,29(5).
Authors:HAN Zhong-jun
Abstract:Distributed file systems were designed by successful search engines providers,and adopt distributing computing,which let Web pages' data and indexing files spread in the network,searching comes from distributing computing.This article analyzes distributing search engines,the Google's distributed file system and MapReduce arithmetic are researched,put forward another arithmetic named FoundClear and a settled project of distributed file system on Nutch,and lastly comparison with GoogleFS system.
Keywords:search engines  distribution  file system
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号