首页 | 本学科首页   官方微博 | 高级检索  
     

基于Hadoop MapReduce并行近似谱聚类算法研究与实现
作者单位:;1.云南财经大学信息学院;2.曲靖市公安局经济技术开发区分局
摘    要:随着信息时代的来临,互联网产生的大规模高维数据呈现几何级数增长,对其进行谱聚类在计算时间和内存使用上都存在瓶颈问题,尤其是求Laplacian矩阵特征向量分解。鉴于Hadoop MapReduce并行编程模型对密集型数据处理的优势,基于t最近邻稀疏化近似相似Laplacian矩阵,设计Hadoop MapReduce并行近似谱聚类算法,以期解决上述瓶颈问题。实验使用UCI Bag of Words数据集验证所设计算法的正确性和有效性,结果显示该并行设计在谱聚类质量和性能方面达到了一定的预期效果。

关 键 词:Hadoop分布式系统  MapReduce并行计算  近似谱聚类算法  稀疏近似相似矩阵  大规模高维数据

RESEARCH AND IMPLEMENTATION OF HADOOP MAPREDUCE-BASED PARALLEL APPROXIMATE SPECTRAL CLUSTERING ALGORITHM
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号