首页 | 本学科首页   官方微博 | 高级检索  
     

基于Lucene.net网络爬虫的设计与实现
引用本文:刘磊安,符志强.基于Lucene.net网络爬虫的设计与实现[J].数字社区&智能家居,2010(8).
作者姓名:刘磊安  符志强
作者单位:仲恺农业工程学院计算机科学与工程学院;
摘    要:网络爬虫采集互联网信息并提供搜索服务。该设计基于Lucene.NET平台开发网络爬虫,可以对特定的网页进行抓取和分析,提取网页中有用信息,并对抓取的数据进行索引,存储到服务器硬盘,同时过滤掉无用信息。系统界面友好,准确高效。

关 键 词:网络爬虫  Lucene.NET  搜索引擎  

The Design and Implementation of Web Crawler based on Lucene.NET
LIU Lei-an,FU Zhi-qiang.The Design and Implementation of Web Crawler based on Lucene.NET[J].Digital Community & Smart Home,2010(8).
Authors:LIU Lei-an  FU Zhi-qiang
Affiliation:Zhongkai University of Agriculture and Engineering;Guangzhou 510225;China
Abstract:Network crawler is internet information collector which offering searching service. The design bases on Lucene.NET platform. It can crawl and analyze the particular webpage, extract useful information, index the data, store it to the server, filter useless information. The engine offer a friendly search interface and search efficiently.
Keywords:network crawler  lucene  net  search engine  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号