首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向分类属性数据的聚类融合算法研究*
引用本文:李桃迎,陈燕,张金松,张琳.一种面向分类属性数据的聚类融合算法研究*[J].计算机应用研究,2011,28(5):1671-1673.
作者姓名:李桃迎  陈燕  张金松  张琳
作者单位:大连海事大学,交通运输管理学院,辽宁,大连,116026
基金项目:国家自然科学基金资助项目(70801007,70940008);国家教育部博士点基金资助项目(200801510001);国家科技支撑计划资助项目(2009BAG13A03);国家教育部科学技术研究重点项目(209030);中央高校基本科研业务费专项资金资助项目(2009QN085)
摘    要:为了解决单一聚类算法存在结果不准确和随机性大,且现有算法对分类数据聚类时将其装换成数值型会产生误差等问题,提出了一种面向分类属性数据的聚类融合算法。算法利用原有分类属性值的差异产生聚类成员,然后采用相似度方法进行划分,通过寻求目标函数最小的划分来简化聚类过程。算法在UCI数据集上进行了验证,结果表明算法的效率和精度都优于现有算法,说明算法的设计和更新策略是有效的。

关 键 词:聚类融合    分类属性数据    数据挖掘    相似度
收稿时间:2010/10/29 0:00:00
修稿时间:4/14/2011 3:40:38 PM

Clustering ensemble algorithm for categorical data
LI Tao-ying,CHEN Yan,ZHANG Jin-song,ZHANG Lin.Clustering ensemble algorithm for categorical data[J].Application Research of Computers,2011,28(5):1671-1673.
Authors:LI Tao-ying  CHEN Yan  ZHANG Jin-song  ZHANG Lin
Affiliation:(College of Transportation Management College, Dalian Maritime University, Dalian Liao ning116026, China)
Abstract:In order to prevent the inaccuracy and randomness of single clustering algorithm, and error of existing clustering algorithm transferring categorical data into numerical data for clustering, this paper proposed the clustering ensemble for categorical data. The algorithm produced clustering memberships by values of categorical data, and then used similarity degree to partition dataset, which reduced the process of clustering by minimizing the objective function. Finally, applied the algorithm into UCI dataset. The results show its efficiency and accuracy are better than existing algorithms, the design and refreshing methods are effective.
Keywords:clustering ensemble  categorical data  data mining  similarity degree
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号