首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于网格方法的高维数据流子空间聚类算法
引用本文:孙玉芬,卢炎生.一种基于网格方法的高维数据流子空间聚类算法[J].计算机科学,2007,34(4):199-203.
作者姓名:孙玉芬  卢炎生
作者单位:华中科技大学计算机科学与技术学院,武汉430074
摘    要:基于对网格聚类方法的分析,结合由底向上的网格方法和自顶向下的网格方法,设计了一个能在线处理高维数据流的子空间聚类算法。通过利用由底向上网格方法对数据的压缩能力和自顶向下网格方法处理高维数据的能力,算法能基于对数据流的一次扫描,快速识别数据中位于不同子空间内的簇。理论分析以及在多个数据集上的实验表明算法具有较高的计算精度与计算效率。

关 键 词:网格  子空间聚类  数据流  高维数据

A Grid-based Subspace Clustering Algorithm for High-dimensional Data Streams
SUN Yu-Fen,LU Yan-Sheng.A Grid-based Subspace Clustering Algorithm for High-dimensional Data Streams[J].Computer Science,2007,34(4):199-203.
Authors:SUN Yu-Fen  LU Yan-Sheng
Affiliation:Computer Department of Huazhong University of Science and Technology, Wuhan 430074
Abstract:Based on the analysis of grid-based clustering algorithms, we propose a subspace clustering algorithm that can find clusters in different subspaces for high-dimensional data streams. The algorithm combines the advantages of bottom-up grid-based method and top-down grid-based method. A uniformly partitioned grid data structure is used to summarize the data stream online. A top-down grid partition method is used o find the subspaces in which clusters locate. Theory analysis and performance study with real datasets and synthetic dataset demonstrate the efficiency and effectiveness of our proposed algorithm.
Keywords:Grid  Subspace clustering  Data stream  High-dimensional data
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号