首页 | 本学科首页   官方微博 | 高级检索  
     

搜索引擎中网络蜘蛛的研究与实现
引用本文:毛晓蛟.搜索引擎中网络蜘蛛的研究与实现[J].电脑编程技巧与维护,2010(18):88-90.
作者姓名:毛晓蛟
作者单位:南京师范大学强化培养学院,南京,210046
摘    要:网络蜘蛛程序是搜索引擎工作的基础和关键,实现了抓取网络资源的网络蜘蛛程序,通过入口网址下载网络资源,并对其分析,获得包含的其他链接,利用这些链接向整个网络扩散,下载其他资源。测试了蜘蛛程序抓取网页的能力,并对多线程实现的利弊进行讨论,总结了常用的算法搜索策略,提出了后续的研究方向。

关 键 词:搜索引擎  网络蜘蛛  多线程  搜索策略

Research and Implement of Search Engine Web Spider
MAO Xiaojiao.Research and Implement of Search Engine Web Spider[J].Computer Programming Skills & Maintenance,2010(18):88-90.
Authors:MAO Xiaojiao
Affiliation:MAO Xiaojiao(Nanjing Normal University Intensification Culture College,Nanjing 210046)
Abstract:The Web Spider is the base and key to Internet search engine.This paper implements the web spider,and downloads resources through a entry web address,then analyze the web page and get the links,then the web spider expands itself with the URLs in the waiting queue.Test the ability of the Spider to get web resources,and discuss about the pluses and minuses of multithreading.Also discuss about some search strategy in Web Spider,and puts forward directions of further researches.
Keywords:Search engine  Web spider  multithreading  search strategy
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号