首页 | 本学科首页   官方微博 | 高级检索  
     

数据流的网格密度聚类算法
引用本文:屠莉,陈崚,邹凌君.数据流的网格密度聚类算法[J].小型微型计算机系统,2009,30(7).
作者姓名:屠莉  陈崚  邹凌君
作者单位:1. 南京航空航天大学,信息与科学技术学院,江苏,南京,210093;江阴职业技术学院,计算机科学系,江苏,江阴,214405
2. 扬州大学,信息学院计算机科学系,江苏,扬州,225009;南京大学,软件新技术国家重点实验室,江苏,南京,210093
3. 扬州大学,信息学院计算机科学系,江苏,扬州,225009
基金项目:国家自然科学基金项目,江苏省自然科学基金项目,省教育厅自然科学基金项目,软件新技术国家重点实验室开放基金 
摘    要:提出一种基于密度的实时数据流聚类算法RTCS.算法采用在线/离线双层框架,它在前台在线层快速实时地将到达的数据点放入相应的单元格,对多维数据和空间单元格动态计算密度.在后台离线层形成初始聚类,并不断地更新单元格的密度来自适应地调整聚类.RTCS算法能够根据密度的动态变化区分出真正的孤立点并剔除之,而这种剔除对后面的聚类结果没有影响.实验结果证明,算法可以很好地挖掘出各种形状的聚类,与CluStream算法相比,取得聚类的质量更高,有更快的处理速度,对数据维数和规模有更好的可扩展性.

关 键 词:数据挖掘  数据流  聚类  实时

Data Stream Clustering Algorithm Based on Grid Density
TU Li,CHEN Ling,ZOU Ling-jun.Data Stream Clustering Algorithm Based on Grid Density[J].Mini-micro Systems,2009,30(7).
Authors:TU Li  CHEN Ling  ZOU Ling-jun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号