首页 | 本学科首页   官方微博 | 高级检索  
     

利用虚拟站点定位技术的网络信息检索研究
引用本文:刘奕群,张敏,马少平. 利用虚拟站点定位技术的网络信息检索研究[J]. 中文信息学报, 2005, 19(2): 45-51
作者姓名:刘奕群  张敏  马少平
作者单位:清华大学智能技术与系统国家重点实验室计算机系,北京 100084
基金项目:国家重点基础研究发展计划(973计划),国家自然科学基金
摘    要:虚拟组织是网格体系结构中的基本组织单元,借鉴网格研究中对虚拟组织的特性分析,可以在网络信息检索研究中定义虚拟站点的概念。实验发现,虚拟站点入口页面是网络信息环境中具有较高质量的一个网页集合:实验表明,仅为全部页面数量21 %的此类页面就涵盖了70 %以上的超链接,对这个集合进行的内容检索也比对网页全集的检索有超过60 %的性能提高。这提供了一种在减少索引规模前提下提高网络信息检索性能的解决方案。

关 键 词:计算机应用  中文信息处理  网络信息检索  非内容特征  虚拟组织  
文章编号:1003-0077(2005)02-0044-07
修稿时间:2004-06-17

Effective Web IR Based on Virtual Site Entry Page Selection
LIU YI-qun,ZHANG Min,MA Shao-ping. Effective Web IR Based on Virtual Site Entry Page Selection[J]. Journal of Chinese Information Processing, 2005, 19(2): 45-51
Authors:LIU YI-qun  ZHANG Min  MA Shao-ping
Affiliation:State Key Lab of Intelligent Technology and Systems , Tsinghua University , Beijing , 100084 ,China
Abstract:Virtual Organization (VO) is a basic concept in grid architecture. Analysis in the link structure of Web pages showed that there exist similar organizations in internet which were called Virtual Sites. Many features of virtual organizations could be founded in virtual sites, especially some non-content features, which were further used to select entry pages of Virtual Sites. This subset of Virtual Site entry pages proved to be qualified both in content and link structure analysis. Although this entry page set contains only about 21% pages of the whole collection, it covers more than 70% of its links. Furthermore, information retrieval on this page set makes more than 60% improvement with respect to that on all pages.
Keywords:computer application  Chinese information processing  Web information retrieval  non-content feature  virtual organization.
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号