首页 | 本学科首页   官方微博 | 高级检索  
     

面向主题的WWW信息挖掘系统
引用本文:余晨 顾毓清. 面向主题的WWW信息挖掘系统[J]. 计算机科学, 2003, 30(2): 158-160
作者姓名:余晨 顾毓清
作者单位:中科院软件所,北京,100080
摘    要:1 概述 WWW正以令人难以置信的速度飞速地发展,逐渐成为人们发布和获取信息的主要平台。虽然人们可以从WWW上获得大量信息,但由于WWW上的信息是无结构的、动态的、分散的,因此如何从WWW上高效地提取有用的信息仍是一个很有挑战性的课题。搜索引擎(如Excite、Google、Alta Vista)的广泛应用,使人们检索信息的效率大大提高。搜索引擎的工作原理是:由一个爬行器(Crawler)尽可能多地收

关 键 词:WWW 信息挖掘系统 网页 搜索引擎 信息检索

Topic-Driven Web Information Mining
YU Chen GU Yu-Qing. Topic-Driven Web Information Mining[J]. Computer Science, 2003, 30(2): 158-160
Authors:YU Chen GU Yu-Qing
Abstract:With the explosive growth of the World-Wide Web, it is becoming increasingly difficult for users to collect and analyze Web pages that are relevant to a particular topic. In this paper ,Topic-Driven Web Information Gathering system is presented,which can efficiently collects Web pages for a topic in relatively limited hardware and network resources,and keeps the pages more up-to-date.
Keywords:Search engine  Topic  Crawler  Authorities   Hubs  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号