首页 | 本学科首页   官方微博 | 高级检索  
     

主题搜索引擎中网络蜘蛛搜索策略的研究
引用本文:王明国,胡敬仓. 主题搜索引擎中网络蜘蛛搜索策略的研究[J]. 微处理机, 2011, 32(4): 34-37. DOI: 10.3969/j.issn.1002-2279.2011.04.010
作者姓名:王明国  胡敬仓
作者单位:国电南瑞科技股份有限公司,南京,210061
摘    要:主题网络蜘蛛的搜索策略是主题搜索引擎的核心部分,是近年来主题搜索引擎研究中的热点问题之一。深入研究了主题网络蜘蛛的关键技术,阐述了多线程网络蜘蛛的实现过程,并对传统的VSM算法和PageRank算法进行了改进,提高了主题网络蜘蛛采集信息的有效性和准确性。

关 键 词:搜索引擎  网络蜘蛛  搜索策略  主题相关  向量空间模型  网页级别

Study of Search Strategy in Topic -oriented Web Spider for Topic- driven Search Engine
WANG Ming-guo,HU Jing-cang. Study of Search Strategy in Topic -oriented Web Spider for Topic- driven Search Engine[J]. Microprocessors, 2011, 32(4): 34-37. DOI: 10.3969/j.issn.1002-2279.2011.04.010
Authors:WANG Ming-guo  HU Jing-cang
Affiliation:WANG Ming-guo,HU Jing-cang(NARI Technology Development Co.,Ltd.,Nanjing 210061,China)
Abstract:The search strategy in topic-oriented web spider is the key component of topic-driven search engine,and is really hot in research in recent years.Based on in-depth research in the search strategy in topic-driven search engine,this article expounds the development processes of the multi-thread web spider,at the same time,improves the traditional VSM algorithm and the PageRank algorithm,and enhances the validation and accuracy of information collection for topic-oriented web spider.
Keywords:Search engine  Web spider  Search strategy  Topic relativity  Vsm  PageRank  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号