首页 | 本学科首页   官方微博 | 高级检索  
     

一种高效的全文检索索引技术*
引用本文:陈玮,陈玉鹏,石晶,陆达.一种高效的全文检索索引技术*[J].计算机应用研究,2004,21(7):35-37.
作者姓名:陈玮  陈玉鹏  石晶  陆达
作者单位:清华大学,光盘国家工程研究中心,北京,100084
基金项目:国家“973”重点基础研究发展规划项目(G19990330)
摘    要:针对目前比较流行的基于词的倒排文档索引模型,结合全文检索数据的特点,提出了变长编码的索引压缩算法。利用该压缩编码,研究了基于内存缓存的快速创建索引的流程。通过实验,对索引膨胀率、创建时间和检索响应速度进行了对比分析,表明该技术提高了索引的空间与时间效率。

关 键 词:全文检索  词索引  内存缓存  索引压缩
文章编号:1001-3695(2004)07-0035-03

A Sort of Full-text Retrieval Technique with High Performance
CHEN Wei,CHEN Yu-peng,SHI Jing,LU Da.A Sort of Full-text Retrieval Technique with High Performance[J].Application Research of Computers,2004,21(7):35-37.
Authors:CHEN Wei  CHEN Yu-peng  SHI Jing  LU Da
Affiliation:(Optical Memory National Engineering Research Center,Tsinghua University,Beijing 100084,China)
Abstract:Discusses the popular word-based inverted file index model and the traits of index data,presents a run-length coding index compression algorithm,utilizing this compression coding,researches fast index creation process based on memory cache.Gives the comparative analysis of index expansion rate,creation time and search response speed by experiment,the result shows that this technique improves the index space and time efficiency.
Keywords:Full-text Retrieval  Word-based Index  Memory Cache  Index Compression
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号