首页 | 本学科首页   官方微博 | 高级检索  
     

基于MapReduce的并行k-modes算法
引用本文:郭涛,丁祥武.基于MapReduce的并行k-modes算法[J].电脑学习,2015,5(1).
作者姓名:郭涛  丁祥武
作者单位:东华大学计算机科学与技术学院,上海,201620
基金项目:国家自然科学基金,上海市自然科学基金
摘    要:k-modes是一种代表性的分类数据的聚类算法.首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对象就能计算出新的簇中心.为了使k-modes能够处理大规模分类数据,在Hadoop平台上用MapReduce并行计算模型实现了k-modes算法.实验表明:在处理大量数据时,并行k-modes比串行k-modes极大地缩短了聚类时间,取得了较好的加速比.

关 键 词:分类数据  k-modes  并行聚类  MapReduce

Parallel k-modes Algorithm based on MapReduce
GUO Tao,DING Xiangwu.Parallel k-modes Algorithm based on MapReduce[J].Computer Study,2015,5(1).
Authors:GUO Tao  DING Xiangwu
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号