首页 | 本学科首页   官方微博 | 高级检索  
     

基于Bagging的聚类集成方法
引用本文:李杉,张化祥.基于Bagging的聚类集成方法[J].计算机工程与设计,2010,31(1).
作者姓名:李杉  张化祥
作者单位:山东师范大学,信息科学与工程学院,山东,济南,250014
基金项目:山东省中青年科学家科研奖励基金项目,山东省高新技术自主创新工程专项计划基金项目,山东省自然科学基金项目,山东省科技攻关计划基金项目,山东省教育厅科技计划基金项目 
摘    要:提出一种基于Bagging的集成聚类方法,采用一种新的数据集采样技术生成数据子集,尽可能的保持了子样本的多样性和最大相关性,然后应用一种改进的k均值聚类算法生成个体学习器,根据互信息对数据集的不同聚类结果进行处理,最后通过计算有争议的数据对象与各个聚类中心的距离将其重新划分到新的聚类结果中.在多个UCI标准数据集上的实验结果表明,该方法能有效改善聚类质量.

关 键 词:聚类  子样本  k均值聚类  个体学习器  互信息

Ensemble clustering method based on Bagging
LI Shan,ZHANG Hua-xiang.Ensemble clustering method based on Bagging[J].Computer Engineering and Design,2010,31(1).
Authors:LI Shan  ZHANG Hua-xiang
Affiliation:LI Shan,ZHANG Hua-xiang(School of Information Science , Engineering,Sh,ong Normal University,Jinan 250014,China)
Abstract:A Bagging-based ensemble methods using a new data sampling technology to keep the diversity and correlation of sub-sample is proposed,and then component learner is generated by using an improved K-means algorithm,the different clustering results of dataset is deal with according to mutual information,finally the distance between disputable object and the clustering center is computed and them is put to new clustering.The experiments on UCI machine learning benchmark data sets show that this method better im...
Keywords:clustering  sub-sample  k-means clustering  component learner  mutual information
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号