首页 | 本学科首页   官方微博 | 高级检索  
     

基于Squeezer算法的数据流离群数据挖掘算法
引用本文:王超,倪志伟,朱小虎. 基于Squeezer算法的数据流离群数据挖掘算法[J]. 计算机技术与发展, 2008, 18(1): 87-89,92
作者姓名:王超  倪志伟  朱小虎
作者单位:合肥工业大学,安徽,合肥,230009
基金项目:国家自然科学基金 , 安徽省教育厅科研项目
摘    要:由于数据流数据的动态性、时序性和数据量大等特点使得数据流上的数据挖掘变得更加困难和富有挑战.通过对Squeezer聚类算法的研究分析,并基于此算法提出了一种新的基于聚类的数据流离群数据检测算法O-Squeezer.把数据流看成一个随时间变化的过程,并将其分成许多数据分区,在每个数据块内用改进的O-Squeezer算法挖掘离群数据.理论分析和实验表明,算法可以有效发现数据流中的局部离群数据,算法是可行的.

关 键 词:数据挖掘  数据流离群数据  质心  Squeezer聚类算法  挖掘算法  数据流  离群数据  Detection Algorithm  Cluster  Based  Outliers  局部  发现  实验  理论  改进  数据块  数据分区  过程  随时间变化  检测算法  聚类算法  分析  研究
文章编号:1673-629X(2008)01-0087-03
收稿时间:2007-03-31
修稿时间:2007-03-31

A Data Stream Outliers Detection Algorithm Based on Squeezer Cluster Algorithm
WANG Chao,NI Zhi-wei,ZHU Xiao-hu. A Data Stream Outliers Detection Algorithm Based on Squeezer Cluster Algorithm[J]. Computer Technology and Development, 2008, 18(1): 87-89,92
Authors:WANG Chao  NI Zhi-wei  ZHU Xiao-hu
Abstract:It is difficult to mine and analyse data streams, because data streams are dynamic, time sequence, have large amount of data. Based on Squeezer cluster algorithm, proposes a new algorithm O- Squeezer to mine ontliers. Data streams will be divided into a lot of data sets,and in each data set the O- Squeezer algorithms will be used to detect outliers. Theoretic analysis and experimental results indicate that the algorithm is effective.
Keywords:data mining  data stream outliers   centroid  Squeezer cluster algorithm
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号