首页 | 本学科首页   官方微博 | 高级检索  
     

高效的随机访问分块倒排文件自索引技术
引用本文:刘小珠,彭智勇,陈旭.高效的随机访问分块倒排文件自索引技术[J].计算机学报,2010,33(6).
作者姓名:刘小珠  彭智勇  陈旭
作者单位:1. 武汉大学软件工程国家重点实验室,武汉,430072;武汉理工大学自动化学院,武汉,430070
2. 武汉大学计算机学院,武汉,430072
基金项目:到国家“九七三”重点基础研究发展规划项目基金(2007CB310806);;国家自然科学基金(60573095);;武汉大学2008年博士研究生自主科研项目(20086350101000066)资助~~
摘    要:针对倒排索引空间开销大、查询时间效率低以及难以同时支持连接布尔查询和排序查询的问题,提出了一种同时提高空间效率与查询时间效率的高效随机访问分块倒排文件自索引RABIF.为了在降低空间消耗的同时支持连接布尔查询与排序查询,RABIF将倒排列表进行合理地分块,然后对每个子块的不同部分采用相应的压缩方式,在不需要插入任何附加辅助信息的前提下实现压缩索引的快速定位与随机访问.理论分析及实验结果表明,与忽略倒排文件自索引SIF相比,提出的RABIF空间开销平均减少5.3%,布尔查询时间平均减少17.8%;对于0.2%与1%排序查询,查询时间分别平均减少34.4%与27.5%.

关 键 词:倒排文件  自索引  时间效率  空间效率  随机访问  

An Efficient Random Access Block Inverted File Self-Index Technology
LIU Xiao-Zhu,PENG Zhi-Yong,CHEN Xu.An Efficient Random Access Block Inverted File Self-Index Technology[J].Chinese Journal of Computers,2010,33(6).
Authors:LIU Xiao-Zhu  PENG Zhi-Yong  CHEN Xu
Affiliation:State Key Laboratory of Software Engineering/a>;Wuhan University/a>;Wuhan 430072;School of Automation/a>;Wuhan University of Technology/a>;Wuhan 430070;School of Computer/a>;Wuhan 430072
Abstract:In order to overcome the problems of the huge space cost,low query performance and being unable to support conjunctive Boolean query and ranking query simultaneously of inverted index,a time and space efficient random access block inverted file(RABIF) self-index is proposed.To decrease space consumption and support conjunctive Boolean query and ranking query simultaneously,the authors' RABIF appropriately divides inverted list into sub-blocks,and then it compresses different parts of each sub-block with cor...
Keywords:inverted file  self-index  time efficiency  space efficiency  random access  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号