首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向高维符号数据的随机投影聚类算法
引用本文:杜奕,卢德唐,黄丰,王磊. 一种面向高维符号数据的随机投影聚类算法[J]. 小型微型计算机系统, 2006, 27(9): 1605-1607
作者姓名:杜奕  卢德唐  黄丰  王磊
作者单位:中国科学技术大学,工程科学软件研究所,安徽,合肥,230027
基金项目:国家重点基础研究发展计划(973计划)
摘    要:现实数据往往分布在高维空间中,从整个向量空间来看,这些数据间的联系非常分散,因此如何降低维数实现高维数据的聚类受到众多研究者的普遍关注.介绍了一种适用于符号型高维数据的随机投影聚类算法.其根据频率选择与聚类相关的维向量,随机产生并根据投影聚类效果择优选择聚类中心及相关维向量,将投影聚类算法扩展至符号数据空间.实验结果证实了这种算法的实用性与有效性.

关 键 词:数据挖掘  符号属性  随机投影聚类  高维数据
文章编号:1000-1220(2006)09-1605-03
收稿时间:2005-06-07
修稿时间:2005-06-072005-12-19

A Random Projected Clustering Algorithm Facing High-Dimensional Categorical Data
DU Yi,LU De-tang,HUANG Feng,WANG Lei. A Random Projected Clustering Algorithm Facing High-Dimensional Categorical Data[J]. Mini-micro Systems, 2006, 27(9): 1605-1607
Authors:DU Yi  LU De-tang  HUANG Feng  WANG Lei
Affiliation:Institute of Engineering and Science Software of University Science and Technology, Hefei 230027 ,China
Abstract:Most of data always exist in high dimensions.From the whole space,the distribution of these data is so separate that it is difficult to find good clusters.Therefore,more and more concerns are placed on how to cluster high-dimensional data.This paper presents a Random Projected Clustering algorithm(RanPC) for categorical data.After selecting related vectors using frequency,the algorithm produces the centers of cluster randomly and chooses good centers according to the clustering effect.This approach expands projected cluster algorithm from numerical space to categorical space.Experiment shows its practicability and effectivity.
Keywords:data mining   categorical attributes   Random Projected Clustering   high-dimensional data
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号