首页 | 本学科首页   官方微博 | 高级检索  
     

一种高维混合属性数据聚类算法
引用本文:孙浩军,闪光辉,高玉龙,袁婷.一种高维混合属性数据聚类算法[J].计算机工程与应用,2015(8).
作者姓名:孙浩军  闪光辉  高玉龙  袁婷
作者单位:汕头大学 工学院,广东 汕头,515063
基金项目:国家自然科学基金(No.61170130)。
摘    要:在许多应用中,很多数据集都具有数值型和分类型数据的混合特征,k-prototype是针对这类数据聚类的经典方法之一,该方法是一种基于k-means和k-mode的聚类方法。在研究了现有的混合属性数据聚类方法之后,引入了一种新算法用于混合型数据聚类,不仅改进了prototype的选取方法,而且提出了一种新的针对混合型数据的相似度度量方式,基于此又提出了一种不同于k-prototype的数据到prototype的分配方式,采用类似层次聚类中凝聚聚类的思想进行聚类,通过在四个真实的混合型数据集上测试发现:与传统算法相比,算法提高了聚类的精度和稳定性。

关 键 词:聚类  混合型数据  相似度计算  层次聚类

GAO Yulong,et al Algorithm for clustering of high-dimensional data mixed with numeric and categorical attributes
SUN Haojun,SHAN Guanghui,GAO Yulong,YUAN Ting.GAO Yulong,et al Algorithm for clustering of high-dimensional data mixed with numeric and categorical attributes[J].Computer Engineering and Applications,2015(8).
Authors:SUN Haojun  SHAN Guanghui  GAO Yulong  YUAN Ting
Abstract:
Keywords:clustering  mixed data  similarity measure  hierarchical clustering
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号