首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于局部共现的查询扩展方法
引用本文:丁国栋,白硕,王斌.一种基于局部共现的查询扩展方法[J].中文信息学报,2006,20(3):86-93.
作者姓名:丁国栋  白硕  王斌
作者单位:1.中国科学院计算技术研究所2.上海证券交易所
基金项目:国家高技术研究发展计划(863计划)
摘    要:针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词与初始查询所表征的主题或概念具有更好的相关性。实验结果表明:与未进行查询扩展时相比,采用LOCOOC方法进行扩展后,平均准确率提高40%以上;与传统的局部反馈方法以及局部上下文分析方法(LCA,Local Context Analysis)相比,LOCOOC不仅具有更优的检索性能,而且有着更好的鲁棒性。

关 键 词:计算机应用  中文信息处理  信息检索  局部共现  查询扩展  LOCOOC  
文章编号:1003-0007(2006)03-0084-08
收稿时间:2005-11-02
修稿时间:2006-02-04

Local Co-occurrence Based Query Expansion for Information Retrieval
DING Guo-dong,BAI Shuo,WANG Bin.Local Co-occurrence Based Query Expansion for Information Retrieval[J].Journal of Chinese Information Processing,2006,20(3):86-93.
Authors:DING Guo-dong  BAI Shuo  WANG Bin
Affiliation:1.Institute of Computing Technology, CAS2.Shanghai Stock Exchange
Abstract:Techniques for automatic query expansion have been extensively studied in information retrieval research as a solution to the word mismatch problem between queries and documents.Using the idea of Local Context Analysis,in this paper we proposed a novel expansion method,called LOCOOC,which utilized the local co-occurrence information in top-ranked documents and the global statistical information in the whole collection to select most appropriate expansion terms.Experimental results show that LOCOOC offers more effective and robust retrieval performances,compared with local feedback based or LCA based expansion method.
Keywords:computer application  Chinese information processing  information retrieval  local co-occurrence  query expansion  LOCOOC  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号