首页 | 本学科首页   官方微博 | 高级检索  
     

TREC2002中的WEB信息检索
引用本文:杨志峰,刘悦,杨哲,王斌,程学旗.TREC2002中的WEB信息检索[J].计算机工程与应用,2003,39(26):37-39,80.
作者姓名:杨志峰  刘悦  杨哲  王斌  程学旗
作者单位:中国科学院计算技术研究所软件研究室,北京,100080
基金项目:国家重点基础研究发展规划973资助项目(编号:G1998030413,G1998030510),计算所领域前沿青年基金(编号:20026180-24)
摘    要:文本检索会议(TextREtrievalConference,TREC)是目前国际上信息检索领域最重要的学术交流与系统评测活动。会议为参加者提供标准的数据集合、评测问题和标准答案,从而使参加者以共同的标准进行系统运行和评测。作者代表中国科学院参加了文本检索会议的WEB信息检索任务。在TREC2002中,作者发现了适合不同数据集合的较高性能的内容检索算法,并综合考虑了文本内容、链接文字、文档结构等因素对WEB信息检索效果的影响,取得了较好的成绩。该方法在两届会议的不同任务中均表现了较高的性能。

关 键 词:信息检索  文本检索会议  Web  Track  评测
文章编号:1002-8331-(2003)26-0037-03

Web Information Retrieval in TREC 2002
Yang Zhifeng Liu Yue Yang Zhe Wang Bin Cheng Xueqi.Web Information Retrieval in TREC 2002[J].Computer Engineering and Applications,2003,39(26):37-39,80.
Authors:Yang Zhifeng Liu Yue Yang Zhe Wang Bin Cheng Xueqi
Abstract:The Text REtrieval Conference(TREC)is the most important academic interaction and system evaluation fo-rum in the information retrieval community.TREC provides standard data collection,topics and relevance judgments for its participants so that they can conduct their retrieval research in a common manner.We took part in Web Track of TREC in2002.We have built an effective information retrieval system which can deal with large amounts of data while showing satisfactory performance on different test collections.We make use of relevance information from other aspects such as anchor texts and document structure as well as the relevance score from traditional IR system.Our approach has shown good performance in both of the Web Track tasks.
Keywords:Information Retrieval  TREC  Web Track  Evaluation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号