首页 | 本学科首页   官方微博 | 高级检索  
     

Heritrix在垂直搜索引擎中的应用
引用本文:白万民,苏希乐.Heritrix在垂直搜索引擎中的应用[J].计算机时代,2011(9):7-9.
作者姓名:白万民  苏希乐
作者单位:西安工业大学;
摘    要:主要介绍了垂直搜索引擎和网络爬虫的基本概念,以及Heritrix系统的体系结构,分析了Heritrix工作流程,并通过扩展Heritrix实现了对网易手机频道信息的多线程抓取,为建立面向手机信息的垂直搜索引擎提供了信息源。

关 键 词:垂直搜索引擎  网络爬虫  Heritrix  多线程

Application of Heritrix in Vertical Search Engine
BAI Wan-min,SU Xi-le.Application of Heritrix in Vertical Search Engine[J].Computer Era,2011(9):7-9.
Authors:BAI Wan-min  SU Xi-le
Affiliation:BAI Wan-min,SU Xi-le(Xi'an Technological University,Xi'an,Shaanxi 710023,China)
Abstract:We mainly introduce the basic concepts of vertical search engine and Web crawler,as well as the architecture of Heritrix,analyze the working process of Heritrix,and achieve multithreaded grabbing the information of NetEase mobile channel by expanding Heritrix,which provides the information source for creating vertical search engine oriented to mobile information.
Keywords:vertical search engine  Web crawler  Heritrix  multithread  
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号