首页 | 本学科首页   官方微博 | 高级检索  
     

基于云计算与非负矩阵分解的数据分级聚类
作者单位:;1.青海广播电视大学;2.钦州学院电子与信息工程学院
摘    要:为了提高传统数据聚类算法在大数据挖掘应用中的性能,借助云计算的相关技术,并结合非负矩阵分解方法设计并实现了一种并行的数据层次聚类算法。该算法采用Map Reduce编程平台,利用Hadoop的HDFS存储大容量的电信运营商数据;描述了Map Reduce的数据分级聚类并行处理的工作机制与流程;通过Map和Reduce这种主-从编程模式很方便地使数据分级聚类的子任务在Hadoop的PC集群上运行。实验结果表明,该方法比传统用于数据聚类的非负矩阵方法具有更好的运行时间与加速比,能够在可以接受的时间范围内完成电信运营商的大数据处理。

关 键 词:云计算  分级聚类  MapReduce  非负矩阵分解  聚类算法  并行数据

Data hierarchical clustering algorithm based on cloud computing and NMF
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号