首页 | 本学科首页   官方微博 | 高级检索  
     

基于循环BloomFilter的数据流上不同值个数的估计
引用本文:任美睿,郭龙江,玄萍.基于循环BloomFilter的数据流上不同值个数的估计[J].计算机工程与应用,2006,42(19):151-154.
作者姓名:任美睿  郭龙江  玄萍
作者单位:1. 黑龙江大学计算机科学技术学院,哈尔滨,150080
2. 黑龙江大学计算机科学技术学院,哈尔滨,150080;哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
基金项目:黑龙江省教育厅科学技术研究项目;黑龙江大学校科研和教改项目
摘    要:数据流是连续的、实时的无限数据,到目前为止还没有有效的方法将数据流存储起来,因此数据流上的不同值个数的估计也就成为一个比较难的研究课题。文章在对BloomFilter进行分析研究的基础上,结合数据流无限、连续、实时等特点,提出了基于循环BloomFilter的数据流上不同值个数的估计策略。将数据流中的不同值存储在循环BloomFilter中,有效地解决了在内存有限情况下,无法保存数据流中的不同值的问题。通过与现有的估计算法的比较,实验结果表明基于循环BloomFilter的估计策略是可行和有效的。

关 键 词:BloomFilter  数据流  不同值个数
文章编号:1002-8331-(2006)19-0151-04
收稿时间:2006-04-01
修稿时间:2006-04-01

The Estimation of the Number of Distinct Values over Data Streams Based on Circular Bloom-Filter
Ren Meirui,Guo Longjiang,Xuan Ping.The Estimation of the Number of Distinct Values over Data Streams Based on Circular Bloom-Filter[J].Computer Engineering and Applications,2006,42(19):151-154.
Authors:Ren Meirui  Guo Longjiang  Xuan Ping
Affiliation:School of Computer Science and Technology, Heilongjiang University, Harbin 150080; 2.School of Computer Science and Technology,Harbin Institute of University,Harbin 150001
Abstract:Due to data streams' continuous,real-time and unbounded nature,at present data streams may not be stored in bounded memory by an effective method,so to estimate the number of distinct values over data streams is a more difficult problem.In this paper,combining with data streams' unbounded,continuous and real-time nature and analyzing BloomFilter,we present the estimation strategy of the number of distinct values over data streams based on circular BloomFilter.We store the distinct values over data streams in circular BloomFilter to solve effectively the problem that the distinct values over data streams can not be stored in bounded memory.Compared with the existing estimation algorithms,the experiments show that the estimation strategy based on circular BloomFilter is feasible and highly effective.
Keywords:BloomFilter
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号