首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于PDS、TIE和PMI的快速PAM聚类算法
引用本文:林建仁,陆佩忠. 一种基于PDS、TIE和PMI的快速PAM聚类算法[J]. 计算机应用与软件, 2008, 25(9)
作者姓名:林建仁  陆佩忠
作者单位:复旦大学计算机科学与工程系,上海,200433
摘    要:PAM(Partitioning Around Medoids)是一种基于k-中心点的聚类算法,在处理数据集聚类时,具有较强的鲁棒性和准确性.但是,PAM算法的主要缺点是确定聚类中心点集所需的计算代价太高.对于大数据集,PAM聚类过程缓慢.提出一种利用部分距离搜索(PDS),先前中心点标号(PMI),以及三角不等式消除(TIE)准则等搜索策略来降低中心点迭代所需计算复杂性,实现快速PAM聚类的新算法.实验结果表明,相对于基本PAM聚类算法,在保持相同聚类效果的情况下,快速PAM聚类新算法能够减少70%~90%的乘法计算量,并可节省约1/3以上的计算时间.

关 键 词:聚类方法  PAM算法  搜索策略(PDS/PMI/TIE)  计算复杂度

AN EFFICIENT PAM CLUSTERING ALGORITHM BASED ON PDS,TIE AND PMI
Lin Jianren,Lu Peizhong. AN EFFICIENT PAM CLUSTERING ALGORITHM BASED ON PDS,TIE AND PMI[J]. Computer Applications and Software, 2008, 25(9)
Authors:Lin Jianren  Lu Peizhong
Affiliation:Lin Jianren Lu Peizhong(Department of Computer Science , Engineering,Fudan University,Shanghai 200433,China)
Abstract:PAM(Partitioning Around Medoids)algorithm is one of the popular k-mediod clustering algorithms,which has strong robustness and correctness when processing large datasets.However,PAM clustering algorithm suffers from heavy computational burden in large data set processing.A novel efficient PAM algorithm is proposed,which utilizes Partial Distance Search (PDS),Previous Medoid Index (PMI),and Triangular Inequality Elimination (TIE) Criteria to facilitate distance computation when searching for optimal medoids....
Keywords:Clustering methods PAM algorithm Search strategy(PDS/PMI/TIE) Computation complexity  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号