首页 | 本学科首页   官方微博 | 高级检索  
     

基于链接描述文本及其上下文的Web信息检索
引用本文:张敏,高剑峰,马少平.基于链接描述文本及其上下文的Web信息检索[J].计算机研究与发展,2004,41(1):221-226.
作者姓名:张敏  高剑峰  马少平
作者单位:1. 清华大学智能技术与系统国家重点实验室,北京,100084
2. 微软亚洲研究院,北京,100080
基金项目:国家“九七三”重点基础研究发展规划项目 (G19980 3 0 5 0 9),国家自然科学基金项目 ( 60 2 2 3 0 0 4),国家“八六三”高技术研究发展计划基金项目 ( 2 0 0 1AA114 0 82 )
摘    要:文档之间的超链接结构是Web信息检索和传统信息检索的最大区别之一,由此产生了基于超链接结构的检索技术。描述了链接描述文档的概念,并在此基础上研究链接文本(anchor text)及其上下文信息在检索中的作用。通过使用超过169万篇网页的大规模真实数据集以及TREC 2001提供的相关文档及评价方法进行测试,得到如下结论:首先,链接描述文档对网页主题的概括有高度的精确性,但是对网页内容的描述有极大的不完全性;其次,与传统检索方法相比,使用链接文本在已知网页定位的任务上能够使系统性能提高96%,但是链接文本及其上下文信息无法在未知信息查询任务上改善检索性能;最后,把基于链接描述文本的方法与传统方法相结合,能够在检索性能上提高近16%。

关 键 词:链接文本  链接描述文档  Web信息检索

Anchor Text and Its Context Based Web Information Retrieval
ZHANG Min ,GAO Jian-Feng ,and MA Shao-Ping.Anchor Text and Its Context Based Web Information Retrieval[J].Journal of Computer Research and Development,2004,41(1):221-226.
Authors:ZHANG Min  GAO Jian-Feng  and MA Shao-Ping
Affiliation:ZHANG Min 1,GAO Jian-Feng 2,and MA Shao-Ping 1 1
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号