首页 | 本学科首页   官方微博 | 高级检索  
     

基于密度的最小生成树聚类算法研究
引用本文:崔光照,曹玲芝,张勋才,王延峰.基于密度的最小生成树聚类算法研究[J].计算机工程与应用,2006,42(5):156-158,164.
作者姓名:崔光照  曹玲芝  张勋才  王延峰
作者单位:1. 华中科技大学控制科学与工程系,武汉,430074;郑州轻工业学院电气信息工程学院,郑州,450002
2. 郑州轻工业学院电气信息工程学院,郑州,450002
3. 华中科技大学控制科学与工程系,武汉,430074
摘    要:基于密度的方法是一种相当有效的聚类方法,能够发现任意形状的聚类,对噪声数据不敏感,但是聚类结果严重依赖于用户参数的合理选择。针对其存在的问题,将最小生成树理论与基于密度的方法相结合,提出了一种基于密度的最小生成树聚类算法。通过构造、分割最小生成树得到确定样本空间划分的最小生成子树;根据子树特性,产生局部密度参数;并对生成子树进行局部密度聚类。理论分析和应用结果表明。该算法不仅体现了基于密度聚类方法的优点,聚类结果不依赖于用户参数的选择,使数据聚类更合理,特别是对大型数据库非常有效;也体现了数据分区的思想,使其可以并行执行,进一步提高了信息处理的时空效率和性能。

关 键 词:聚类  最小生成树  密度  数据挖掘
文章编号:1002-8331-(2006)05-0156-03
收稿时间:2005-09
修稿时间:2005-09

Research of Density-Based MST Clustering Algorithm
Cui Guangzhao,Cao Lingzhi,Zhang Xuncai,Wang Yanfeng.Research of Density-Based MST Clustering Algorithm[J].Computer Engineering and Applications,2006,42(5):156-158,164.
Authors:Cui Guangzhao  Cao Lingzhi  Zhang Xuncai  Wang Yanfeng
Affiliation:1.Department of Control Science and Engineering,Huazhong University of Science and Technology,Wuhan 430074; 2.College of Electrical Information Engineering,Zhengzhou Institute of Light Industry, Zhengzhou 450002
Abstract:Density-based method is one of the effective and efficient clustering methods that can discover clusters with arbitrary shape and is insensitive to noise data.But some parameters should be determined by hand.However,it is very difficuh to determine them manually without any prior domain knowledge.To solve this problem,an applicable and efficient density-based minimum spanning tree clustering algorithm is presented.It aims at avoiding any parameter to be determined by hand ,and at the same time ,improving the efficiency of clustering.Theory analysis and experimental results show that this approach not only keeps the good features of DBSCAN,but also requires no input parameters and can make paralleled processing.
Keywords:cluster  minimum spanning tree  density  data mining
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号