首页 | 本学科首页   官方微博 | 高级检索  
     

基于动态文档集的索引技术*
引用本文:潘隆禧,孙乐.基于动态文档集的索引技术*[J].计算机应用研究,2009,26(1):15-18.
作者姓名:潘隆禧  孙乐
作者单位:1. 中国科学院,软件研究所,北京,100190;中国科学院,研究生院,北京,100049
2. 中国科学院,软件研究所,北京,100190
基金项目:国家语委资助项目(MZ115-021)
摘    要:倒排文件是全文检索中广泛使用的索引结构,对静态文档集合建立倒排索引的研究已有较长时间。随着计算机技术的发展,需要存储的数据越来越大。同时特定的应用领域如新闻搜索、桌面搜索等对实时更新性能要求较高,这需要使用有效的索引更新策略,也称动态索引。描述了常用的动态索引技术,并详细分析了其使用代价。

关 键 词:倒排表  索引的建立  索引更新

Index technique for dynamic corpus
PAN Long-xi,SUN Le.Index technique for dynamic corpus[J].Application Research of Computers,2009,26(1):15-18.
Authors:PAN Long-xi  SUN Le
Affiliation:(1.Institute of Software, Chinese Academy of Sciences, Beijing 100190, China; 2.Graduate School, Chinese Academy of Sciences, Beijing 100049, China)
Abstract:Inverted list is the main data structure used in IR. The off-line index construction about static corpus has been under research for a long time. As the development of computer, the data capacity become larger and larger and in some specific domains such as news search and desktop search which demand high quality about index update, all of these needs us to find a efficient index update way. This paper described and analyzed several efficient index update strategy in common use.
Keywords:inverted list  index construction  index update
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号