首页 | 本学科首页   官方微博 | 高级检索  
     

混合属性数据流的二重k近邻聚类算法
引用本文:黄德才,沈仙桥,陆亿红. 混合属性数据流的二重k近邻聚类算法[J]. 计算机科学, 2013, 40(10): 226-230
作者姓名:黄德才  沈仙桥  陆亿红
作者单位:浙江工业大学计算机科学与技术学院 杭州 310023
基金项目:本文受农村水电效益分析与增效关键技术研究与示范,水利部公益性行业科研专项(201001031)资助
摘    要:
现有的数据流聚类算法大都只能处理单一数值属性的数据,不能应对同时包含数值属性与分类属性特征的数据,且已存在的混合属性数据流聚类算法在对数据的标准化处理和聚类上还有很大的改进之处,为此,提出二重k近邻混合属性数据流聚类算法.该算法采用CluStream算法的在线、离线框架,并提出了混合属性数据流下三步聚类的思想.算法先运用二重k近邻和改进的维度距离生成微聚类,然后利用动态标准化数据方法和基于均值的余弦模型生成初始宏聚类,最后利用基于均值的余弦模型和先验聚类结果进行宏聚类优化.实验结果表明,所提出的算法具有良好的聚类质量及可扩展性.

关 键 词:数据流  混合属性  聚类  二重k近邻
收稿时间:2013-01-09
修稿时间:2013-04-14

Double k-nearest Neighbors of Heterogeneous Data Stream Clustering Algorithm
HUANG De-cai,SHEN Xian-qiao and LU Yi-hong. Double k-nearest Neighbors of Heterogeneous Data Stream Clustering Algorithm[J]. Computer Science, 2013, 40(10): 226-230
Authors:HUANG De-cai  SHEN Xian-qiao  LU Yi-hong
Affiliation:College of Computer Science and Technology,Zhejiang University of Technology,Hangzhou 310023,China;College of Computer Science and Technology,Zhejiang University of Technology,Hangzhou 310023,China;College of Computer Science and Technology,Zhejiang University of Technology,Hangzhou 310023,China
Abstract:
Keywords:Data stream  Heterogeneous  Clustering  Double k-nearest neighbors
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号