首页 | 本学科首页   官方微博 | 高级检索  
     

分布式网络中的一种高效top-k求解方法研究
引用本文:李雷,李晓东,刘欣阳.分布式网络中的一种高效top-k求解方法研究[J].计算机工程与应用,2010,46(18):89-92.
作者姓名:李雷  李晓东  刘欣阳
作者单位:中国科学院,计算机网络信息中心,北京,100190
基金项目:中科院创新基金重点支持项目 
摘    要:提出了一种新的算法,来解决在分布式的环境中top-k求解问题(求出全局数值最大的前k名)。之前的研究,例如TA、TPUT、HT算法,都会消耗大量的带宽。KLEE算法虽然能够大大地减少带宽的消耗,却不能给出精确解。而提出的算法FT由于添加了一个预处理阶段并且使用了histogram bloom技术,即能有效地减少带宽的消耗,又能给出精确解。实现了FT和相关的算法,并进行了全面的比较。比较是建立在真实的数据集和根据不同情况合成的数据集的基础上的。实验结果显示FT在带宽消耗上面,相对于其他算法有很大的改进和优势。

关 键 词:top-k算法  分布式网络  histogram  blooms技术
收稿时间:2008-12-4
修稿时间:2009-3-17  

FT:Efficient top-k algorithm in distributed networks
LI Lei,LI Xiao-dong,LIU Xin-yang.FT:Efficient top-k algorithm in distributed networks[J].Computer Engineering and Applications,2010,46(18):89-92.
Authors:LI Lei  LI Xiao-dong  LIU Xin-yang
Affiliation:Computer Network and Information Center,Chinese Academy of Sciences,Beijing 100190,China
Abstract:A new algorithm FT to answer top-k queries(find the k objects with the highest aggregate scores) in a distributed net-work is proposed.Prior research such as Threshlod Algorithm(TA),Three-Phase Uniform-Threshold(TPUT) algorithm and Hybrid-Threshold(HT) algorithm consume an excessive amount of bandwidth.KLEE algorithm can reduce network bandwidth consumption but it can't give exact top-k answers.The algorithm FT can both reduce network bandwidth and give the exact top-k answer based on the pretreatment in the first phase and the histogram bloom.This paper implements FT and related algorithms and conducts a comprehensive performance evaluation.Evaluation employs real-world and synthetic data sets.The experiment shows that FT can achieve major performance in terms of network bandwidth.
Keywords:top-k algorithm  distributed networks  histogram blooms
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号