首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于参考点和密度的快速聚类算法
引用本文:马帅,王腾蛟,唐世渭,杨冬青,高军. 一种基于参考点和密度的快速聚类算法[J]. 软件学报, 2003, 14(6): 1089-1095
作者姓名:马帅  王腾蛟  唐世渭  杨冬青  高军
作者单位:1. 北京大学,计算机科学技术系,北京,100871
2. 北京大学,计算机科学技术系,北京,100871;北京大学,视觉与听觉信息处理国家重点实验室,北京,100871
基金项目:Supported by the National High-Tech Research and Development Plan of China under Grant No.2002AA483440 (国家高技术研究发展计划(863)); the National Grand Fundamental Research 973 Program of China under Grant No.G1999032705 (国家重点基础研究发展规划(973)); the Foundation of the Innovation Research Institute of PKU-IBM of China (北京大学-IBM创新研究院项目)
摘    要:数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在于,通过参考点来准确地反映数据的空间几何特征,然后基于参考点对数据进行分析处理.CURD算法保持了基于密度的聚类算法的上述优点,而且CURD算法具有近似线性的时间复杂性,因此CURD算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CURD算法具有处理任意形状的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的基于R*-树的DBSCAN算法.

关 键 词:聚类  密度  高维  参考点  数据挖掘
收稿时间:2002-04-19
修稿时间:2002-07-02

A Fast Clustering Algorithm Based on Reference and Density
MA Shuai,WANG Teng-Jiao,TANG Shi-Wei,YANG Dong-Qing and GAO Jun. A Fast Clustering Algorithm Based on Reference and Density[J]. Journal of Software, 2003, 14(6): 1089-1095
Authors:MA Shuai  WANG Teng-Jiao  TANG Shi-Wei  YANG Dong-Qing  GAO Jun
Abstract:
Keywords:clustering  density  high dimension  reference  data mining
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号