首页 | 本学科首页   官方微博 | 高级检索  
     

一种混合属性数据流聚类算法
引用本文:杨春宇,周杰. 一种混合属性数据流聚类算法[J]. 计算机学报, 2007, 30(8): 1364-1371
作者姓名:杨春宇  周杰
作者单位:清华大学自动化系,北京,100084;清华大学自动化系,北京,100084
摘    要:数据流聚类是数据流挖掘中的重要问题.现实世界中的数据流往往同时具有连续属性和标称属性,但现有算法局限于仅处理其中一种属性,而对另一种采取简单舍弃的办法.目前还没有能在算法层次上进行混合属性数据流聚类的算法.文中提出了一种针对混合属性数据流的聚类算法;建立了数据流到达的泊松过程模型;用频度直方图对离散属性进行了描述;给出了混合属性条件下微聚类生成、更新、合并和删除算法.在公共数据集上的实验表明,文中提出的算法具有鲁棒的性能.

关 键 词:数据挖掘  数据流  聚类分析  混合属性  泊松过程
修稿时间:2007-03-05

A Heterogeneous Data Stream Clustering Algorithm
YANG Chun-Yu,ZHOU Jie. A Heterogeneous Data Stream Clustering Algorithm[J]. Chinese Journal of Computers, 2007, 30(8): 1364-1371
Authors:YANG Chun-Yu  ZHOU Jie
Affiliation:Department of Automation, Tsinghua University, Beijing 100084
Abstract:
Keywords:data mining  data stream  clustering  heterogeneous attributes  Poisson process
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号