首页 | 本学科首页   官方微博 | 高级检索  
     

聚类分析中类数估计方法的实验比较
引用本文:王开军,李健,张军英,过立新.聚类分析中类数估计方法的实验比较[J].计算机工程,2008,34(9):198-199.
作者姓名:王开军  李健  张军英  过立新
作者单位:1. 西安电子科技大学计算机学院,西安,710071
2. 西北政法大学网络信息中心,西安,710061
3. 西安邮电学院,西安,710061
摘    要:在基因表达数据的探索性聚类分析中,聚类个数的确定是决定聚类质量的关键因素。许多聚类有效性评价指标和方法可用于PAM聚类算法。该文讨论适合于PAM算法的7种常用评价指标和方法,采用4种不同聚类结构特征的基因表达数据对它们的性能进行实验比较。结果表明,系统演化方法和稳定性方法估计聚类个数的性能最好,正确率分别为100%与90%。

关 键 词:聚类有效性  聚类个数估计  聚类分析  基因表达数据
文章编号:1000-3428(2008)09-0198-02
修稿时间:2007年5月10日

Experimental Comparison of Clusters Number Estimation for Cluster Analysis
WANG Kai-jun,LI Jian,ZHANG Jun-ying,GUO Li-xin.Experimental Comparison of Clusters Number Estimation for Cluster Analysis[J].Computer Engineering,2008,34(9):198-199.
Authors:WANG Kai-jun  LI Jian  ZHANG Jun-ying  GUO Li-xin
Affiliation:(1. School of Computer Science and Engineering, Xidian University, Xi’an 710071; 2. Net Information Center, Northwest University of Political Science and Law, Xi’an 710061; 3. Xi’an Institute of Post and Telecommunications, Xi’an 710061)
Abstract:Estimation of clusters number is a crucial problem for applying robust Partitioning Around Medoid(PAM) clustering algorithm to gene expression data. This paper discusses seven methods of cluster validation for PAM algorithm and gives their experimental comparison on estimation of the clusters number, using simulated and real gene expression data that hold four different types of cluster structures. Experimental results show that the system evolution method and stability-based method give estimation accuracy of 90% and 100%.
Keywords:cluster validation  clusters number estimation  cluster analysis  gene expression data
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号