首页 | 本学科首页   官方微博 | 高级检索  
     

大数据负载的体系结构特征分析
作者姓名:罗建平  谢梦瑶  王华锋
作者单位:中国科学院计算技术研究所先进计算机系统研究中心 北京100190;北京航空航天大学软件学院 北京10091,中国科学院计算技术研究所先进计算机系统研究中心 北京100190;郑州大学信息工程学院 郑州450001,北京航空航天大学软件学院 北京10091
基金项目:本文受国家重点基础研究发展规划项目(2014CB340402),国家自然科学基金(61303054)资助
摘    要:针对大数据离线分析类和交互式查询类负载,首先对这些负载的一些共性进行分析,提取出公共操作集,并对它们进行分组整理;然后在大数据平台上测试这些负载运行过程中的微体系结构特征,采用PCA和SimpleKMeans算法对这些体系结构特征参数进行降维和聚类处理。实验分析结果表明负载之间有公共的操作集,如Join和Cross Production;有些负载有相似的属性,如Difference和Projection共享相同的微体系结构特征。实验结果对于 处理器等硬件平台的设计以及应用程序的优化具有指导性的意义,并且为大数据基准测试平台的设计提供了参考。

关 键 词:大数据  大数据负载  体系结构特征
收稿时间:2014-10-17
修稿时间:2014-12-01
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号