首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于动态近邻选择模型的聚类算法
引用本文:金阳,左万利.一种基于动态近邻选择模型的聚类算法[J].计算机学报,2007,30(5):756-762.
作者姓名:金阳  左万利
作者单位:吉林大学计算机科学与技术学院,长春,130012
摘    要:ROCK是Sudipno Guha等1999年提出的一个著名的面向分类属性数据的聚类算法,其突出贡献是采用公共近邻(链接)数的全局信息作为评价数据点间相关性的度量标准,而不是传统的基于两点间距离的局部度量函数.尽管ROCK在Mushroom等分类属性数据集上取得了很好的聚类结果,但该算法本身也存在一些缺陷和不足.首先,衡量两个数据点是否为邻居的相似度阈值θ需要预先静态指定,该阈值对聚类质量影响很大,在对数据集没有充分了解的前提下给出恰当的阈值是困难的.其次,在ROCK算法中,相似度函数sim仅被用于最初邻居的判断上,只考虑相似与否,而未考虑相似程度,使算法对θ值过于敏感.另外,ROCK还要求用户事先选定聚类簇数k.这些缺陷或者影响聚类效果,或使算法不便使用.该文深入分析了上述问题,并提出基于动态近邻选择模型的聚类算法DNNS,通过优选近邻来提高聚类质量.文中还定义了内聚度度量函数以指导聚类过程.对标准数据集VOTE和ZOO的实验结果表明,DNNS算法的fα指标优于ROCK和VBACC.

关 键 词:数据挖掘  聚类  类别属性  动态  近邻  选择模型  聚类算法  Model  Selection  Neighbors  Dynamic  指标  实验  标准  过程  指导  内聚度  聚类质量  优选  问题  分析  使用  聚类效果
修稿时间:2006-03-142006-11-23

A Clustering Algorithm Using Dynamic Nearest Neighbors Selection Model
JIN Yang,ZUO Wan-Li.A Clustering Algorithm Using Dynamic Nearest Neighbors Selection Model[J].Chinese Journal of Computers,2007,30(5):756-762.
Authors:JIN Yang  ZUO Wan-Li
Affiliation:College of Computer Science and Technology, Jilin University, Changchun 130012
Abstract:
Keywords:data mining  clustering  categorical attributes
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号