首页 | 本学科首页   官方微博 | 高级检索  
     

BIRCH混合属性数据聚类方法
引用本文:李贤,罗可. BIRCH混合属性数据聚类方法[J]. 计算机工程与应用, 2009, 45(30): 123-125. DOI: 10.3778/j.issn.1002-8331.2009.30.038
作者姓名:李贤  罗可
作者单位:长沙理工大学,计算机与通信学院,长沙,410004;长沙理工大学,计算机与通信学院,长沙,410004
基金项目:国家自然科学基金,湖南省科技计划项目基金,湖南省教育厅科研项目基金 
摘    要:数据聚类是数据挖掘中的重要研究内容。现实世界中的数据往往同时具有连续属性和离散属性,但现有大多数算法局限于仅处理其中一种属性,而对另一种采取简单舍弃的办法丢失聚类信息和降低聚类质量。一些能处理混合属性的算法又往往处理的属性过多,导致计算量的大增。提出了一种基于BIRCH算法的混合属性数据的聚类算法;在UCI数据集上的实验表明,文中提出的算法具有较好的性能。

关 键 词:数据挖掘  聚类  BIRCH算法  混合属性
收稿时间:2009-04-27
修稿时间:2009-6-17 

Heterogeneous data clustering algorithm of BIRCH
LI Xian,LUO Ke. Heterogeneous data clustering algorithm of BIRCH[J]. Computer Engineering and Applications, 2009, 45(30): 123-125. DOI: 10.3778/j.issn.1002-8331.2009.30.038
Authors:LI Xian  LUO Ke
Affiliation:Department of Computer and Communication,Changsha University of Science & Technology,Changsha 410004,China
Abstract:Data clustering is an important issue in data mining.Many real-world data have both continuous attributes and categorical attributes,which are usually called heterogeneous attributes.However,most of the existing mining algorithms can manipulate only continuous attributes or categorical attributes.Simply omitting categorical or continuous attributes may lose important information about the data and decrease the mining quality.Some other algorithms which can manipulate continuous attributes and categorical attributes have low efficiency,because of a lot of attributes.This paper proposes a novel approach for clustering data with heterogeneous features based on BIRCH.Experimental results on public data sets show that the proposed algorithm is robust.
Keywords:data mining  clustering  BIRCH algorithm  heterogeneous attribute
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号