首页 | 本学科首页   官方微博 | 高级检索  
     

基于Nutch的搜索引擎的研究
引用本文:胡涛,路红英.基于Nutch的搜索引擎的研究[J].计算机时代,2007(1):57-59.
作者姓名:胡涛  路红英
作者单位:北京交通大学计算机与信息技术学院,北京,100044
摘    要:Nutch是一个开放源代码的Web搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代的商业搜索引擎工作原理一样,即网页搜集、预处理(建立索引)和查询服务.由于不夹杂商业利益,它对搜索结果的排序算法较为透明公平.我们可以利用Nutch并结合中文分词技术来构建自己的中文搜索引擎.

关 键 词:Nutch  Lucene  中文分词  评分机制
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号