首页 | 本学科首页   官方微博 | 高级检索  
     

一种索引结构的压缩存储及其查询处理技术
引用本文:骆吉洲,李建中.一种索引结构的压缩存储及其查询处理技术[J].计算机工程与应用,2007,43(8):149-153.
作者姓名:骆吉洲  李建中
作者单位:哈尔滨工业大学,计算机科学与技术学院,哈尔滨,150001;哈尔滨工业大学,计算机科学与技术学院,哈尔滨,150001
摘    要:在全文信息检索系统中,存储文本及其上关键词的索引结构需要大量的空间。位图索引不能支持基于信息量的查询,倒排文件需要的空间比较大。提出了频率向量这种索引结构的压缩存储方法,设计并实现了基于这种压缩存储方法的存储结构,理论分析表明该压缩方法与存储结构可以获得较高的压缩比;此外,还讨论了压缩频率向量上的查询处理技术,实验结果表明这种压缩的索引结构能够保证查询结果的完备性,并能有效地提高频率向量的存储和查询效率。

关 键 词:频率向量  压缩  离散化  查询处理  倒排索引
文章编号:1002-8331(2007)08-0149-05
修稿时间:2006-08

Compression and query processing methods of kind of index
LUO Ji-Zhou,LI Jian-zhong.Compression and query processing methods of kind of index[J].Computer Engineering and Applications,2007,43(8):149-153.
Authors:LUO Ji-Zhou  LI Jian-zhong
Affiliation:School of Computer Science and Technology, Harbin Institute of Technology,Harbin 150001 ,China
Abstract:In full-text retrieval systems,keyword-based indexes is always an important technique for efficient information retrieval.Existing bitmaps can't support queries based on the quantum of keywords and inverted files need a large amount of storage space.A compression method and a storage structure for a kind of index named frequency vectors are presented in this paper.Theoretical analysis gives a upper bound of compression ratio.Query processing method based on the compressed index is also discussed.Experimental results indicate that this compressed index can guarantee to obtain complete query results and high efficiency.
Keywords:frequency vectors  compression  discretization  query procession  inverted index
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号