首页 | 本学科首页   官方微博 | 高级检索  
     

FM-index分块并行算法及其实现
引用本文:李开士,张云泉,李玉成.FM-index分块并行算法及其实现[J].计算机工程,2008,34(8):53-55.
作者姓名:李开士  张云泉  李玉成
作者单位:1. 中国科学院研究生院,北京,100080;中国科学院软件研究所并行计算实验室,北京,100080;中国科学院计算机科学国家重点实验室,北京,100080
2. 中国科学院软件研究所并行计算实验室,北京,100080;中国科学院计算机科学国家重点实验室,北京,100080
3. 中国科学院软件研究所并行计算实验室,北京,100080
基金项目:国家自然科学基金 , 国家自然科学基金 , 国家重点基础研究发展计划(973计划) , 国家高技术研究发展计划(863计划) , 中国科学院与审计署合作研究基金
摘    要:在查询海量数据时,有压缩和索引两种方法来提高速度,。该文结合这两种方法提出了压缩查询的方法。FM-index是一种自索引的全文查询算法,。这种算法存在内存占用过大的问题,并且对于复杂的查询效率也不理想,。该文于是提出了分块FM-index算法,,并在分块的基础上采用MPI对该分块算法进行了并行化,。成功地解决了内存占用过多的问题,并达到了较好的并行效率。

关 键 词:压缩  自索引  FM-index算法  分块  并行
文章编号:1000-3428(2008)08-0053-02
修稿时间:2007年4月30日

Parallelization of Blocked FM-index Algorithm and Its Implementation
LI Kai-shi,ZHANG Yun-quan,LI Yu-cheng.Parallelization of Blocked FM-index Algorithm and Its Implementation[J].Computer Engineering,2008,34(8):53-55.
Authors:LI Kai-shi  ZHANG Yun-quan  LI Yu-cheng
Affiliation:(1. Graduate University ofSchool ,of Chinese Academy of Sciences, Beijing 100080; 2 . Lab. of Parallel Computing, Institute of Software, Chinese Academy of Sciences, Beijing 100080; 3. State Key Laboratory of Computer Sciences, Chinese Academy of SciencesCAS, Beijing 100080)
Abstract:When dealing with massive volume data,there are two ways to achieve high performance:one is to compress and the other one is to build index.Combining these two methods,compressed query is proposed.FM-index is such a compressed self-index algorithm used for full-text query.The algorithm occupies a large amount of main memory and is unable to handle complex query efficiently.To deal with these problems,this paper proposes a blocked version FM-index algorithm and parallelizes it using MPI.The blocked algorithm...
Keywords:compression  self-index  FM-index  blocking  parallelization
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号