首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进的凝聚性和分离性的层次聚类算法
引用本文:郭景峰,赵玉艳,边伟峰,李晶.基于改进的凝聚性和分离性的层次聚类算法[J].计算机研究与发展,2008,45(Z1):202-206.
作者姓名:郭景峰  赵玉艳  边伟峰  李晶
作者单位:燕山大学信息科学与工程学院,秦皇岛,066004
摘    要:由于传统的数据聚类算法都是在单一表上进行,因此如何在多表中进行聚类是现在聚类分析的一个新方向.提出了一种基于改进的凝聚性和分离性的层次聚类算法--ICCSH(a hierarchical clustering algorithm based on improved cluster cohesion and separation),该算法首先通过ID传播把关系数据库中的各个表联系起来,再通过计算共享最近邻的相似度和改进的凝聚性算法将数据对象聚类为大量相对较小的子聚类,然后通过计算改进的簇间分离性合并子类来找到真正的结果簇.实验表明,该算法不仅运行时间相对较短,具有较强的可伸缩性,还可以得到较高精确的聚类结果.

关 键 词:共享最近邻  关系数据库  层次聚类  凝聚性  分离性
修稿时间:2007年7月10日

A Hierarchical Clustering Algorithm Based on Improved Cluster Cohesion and Separation
Guo Jingfeng,Zhao Yuyan,Bian Weifeng,Li Jing.A Hierarchical Clustering Algorithm Based on Improved Cluster Cohesion and Separation[J].Journal of Computer Research and Development,2008,45(Z1):202-206.
Authors:Guo Jingfeng  Zhao Yuyan  Bian Weifeng  Li Jing
Affiliation:Guo Jingfeng,Zhao Yuyan,Bian Weifeng,, Li Jing(Collage of Information Science , Engineering,Yanshan University,Qinhuangdao 066004)
Abstract:The clustering about relational databases is an active study subject in data mining. In this paper, we introduce a Hierarchical Clustering Algorithm Based on Improved Cluster Cohesion and Separation. First, this algorithm joins every table through the tuple ID propagation. Then, groups objects into a large number of relatively small sub-clusters using the shared nearest neighbor algorithm and the improved cluster cohesion algorithm. Last, find the genuine clusters by repeatedly combining these sub-clusters ...
Keywords:shared nearest neighbor  relational database  hierarchical clustering  cohesion  separation  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号