首页 | 本学科首页   官方微博 | 高级检索  
     

多层核心集凝聚算法
引用本文:马儒宁,王秀丽,丁军娣.多层核心集凝聚算法[J].软件学报,2013,24(3):490-506.
作者姓名:马儒宁  王秀丽  丁军娣
作者单位:南京航空航天大学 理学院,江苏 南京 211100;南京航空航天大学 理学院,江苏 南京 211100;南京理工大学 计算机科学与技术学院,江苏 南京 210094
基金项目:国家自然科学基金(61103058, 61233011, 61272220)
摘    要:许多经典的聚类算法,如平均链接,K-means,K-medoids,Clara,Clarans等,都是利用单一的聚类中心进行聚类.为克服单一聚类中心只能描述凸状聚类的缺陷,CURE,DBSCAN等算法使用多个代表点(或稠密点)表述任意形状的聚类结构,但仍难以聚类重叠和噪声数据.为此,提出一种基于多层聚类中心(称为核心集)的凝聚聚类算法(MulCA).该算法使用了多层核心集表述聚类结构,使得每一层数据集向其核心集凝聚.同时,上层的核心集自动成为下层的数据集.随着每层核心集规模按α比例迅速减少,控制了凝聚过程的迭代次数.此外,引入了基于随机采样计算ε-核心集(RBC)的技巧,将MulCA算法应用于大规模数据集.大量的数值实验充分验证了MulCA算法的有效性.

关 键 词:多层  核心集  凝聚  大规模
收稿时间:3/7/2012 12:00:00 AM
修稿时间:2012/9/12 0:00:00

Multilevel Core-Sets Based Aggregation Clustering Algorithm
MA Ru-Ning,WANG Xiu-Li and DING Jun-Di.Multilevel Core-Sets Based Aggregation Clustering Algorithm[J].Journal of Software,2013,24(3):490-506.
Authors:MA Ru-Ning  WANG Xiu-Li and DING Jun-Di
Affiliation:College of Science, Nanjing University of Aeronautics and Astronautics, Nanjing 211100, China;College of Science, Nanjing University of Aeronautics and Astronautics, Nanjing 211100, China;School of Computer Science and Technology, Nanjing University of Science and Technology, Nanjing 210094, China
Abstract:
Keywords:multilevel  core-set  aggregation  large size
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号