首页 | 本学科首页   官方微博 | 高级检索  
     

分布式流数据频繁项发现算法的研究
引用本文:杨颖,杨磊.分布式流数据频繁项发现算法的研究[J].计算机应用,2008,28(1):136-139.
作者姓名:杨颖  杨磊
作者单位:1. 广西大学,计算机与电子信息学院,南宁,530004
2. 广西计算中心,南宁,530022
基金项目:国家高技术研究发展计划(863计划) , 广西自然科学基金 , 广西教育厅桂教科研项目
摘    要:对分布式流数据中频繁项的发现算法进行了研究,利用一种新颖的分布式概要算法(DSA)来发现从叶子节点直至根节点的概要结构,通过在不同的分布状态下设置相应的精确梯度来最小化通信负载,并利用真实数据集验证了该结构和算法的有效性。

关 键 词:流数据  频繁项  概要结构
文章编号:1001-9081(2008)01-0136-04
收稿时间:2007-07-18
修稿时间:2007年7月18日

Study on discovering frequent items algorithm for distributed data stream
YANG Ying,YANG Lei.Study on discovering frequent items algorithm for distributed data stream[J].journal of Computer Applications,2008,28(1):136-139.
Authors:YANG Ying  YANG Lei
Affiliation:YANG Ying1,YANG Lei2(1. School of Computer , Electronics Information,Guangxi University,Nanning Guangxi 530004,China,2. Computing Center of Guangxi,Nanning Guangxi 530022,China)
Abstract:To study the algorithms for discovering the frequent items of distributed data streams, a novel algorithm was applied to find the synopsis structures from leaf nodes to root node by Distributed Synopsis Algorithm (DSA), and minimize the communicated loads through the relevant diagrent under different conditions. The experiment verifies the efficiency of the algorithm and structure by real data sets.
Keywords:data stream  frequent item  synopsis  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号