首页 | 本学科首页   官方微博 | 高级检索  
     

支持Web信息分类的高性能蜘蛛程序
引用本文:高克宁,柴桥子,张斌,马安香. 支持Web信息分类的高性能蜘蛛程序[J]. 小型微型计算机系统, 2006, 27(7): 1308-1312
作者姓名:高克宁  柴桥子  张斌  马安香
作者单位:东北大学,信息学院,计算机应用技术研究所,辽宁,沈阳,110004
摘    要:随着Web信息的快速增长,如何提高信息检索的准确率,如何展示检索结果,成为Web信息检索的重点研究内容,本文设计一种新的蜘蛛程序T—Spider,采用分布式两级并行控制,在获取Web信息的同时,获取网站结构,从而支持基于网站结构的信息分类.

关 键 词:蜘蛛程序  信息分类  网站结构  分布式
文章编号:1000-1220(2006)07-1308-05
收稿时间:2005-03-31
修稿时间:2005-03-31

High Performance T-Spider of Supporting Web Information Classification
GAO Ke-ning,CHAI Qiao-zi,ZHANG Bin,MA An-xiang. High Performance T-Spider of Supporting Web Information Classification[J]. Mini-micro Systems, 2006, 27(7): 1308-1312
Authors:GAO Ke-ning  CHAI Qiao-zi  ZHANG Bin  MA An-xiang
Affiliation:Information Science and Engineering, College of Northeastern University, Institute of Computer Application Techniques, Shenyang 110004, China
Abstract:As Web information grows quickly, how to improve accuracy of information retrieval and how to organize searching result set has being a research focus of Web information retrieval. This paper proposed a new spider called T-spider, which was consisted of two levels parallelization control, so to obtain Website structure when downloading info pages, and to support site structure based classification.
Keywords:spider    information classification    website structure   distribution
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号