大数据负载的体系结构特征分析 |
| |
作者姓名: | 罗建平 谢梦瑶 王华锋 |
| |
作者单位: | 中国科学院计算技术研究所先进计算机系统研究中心 北京100190;北京航空航天大学软件学院 北京10091,中国科学院计算技术研究所先进计算机系统研究中心 北京100190;郑州大学信息工程学院 郑州450001,北京航空航天大学软件学院 北京10091 |
| |
基金项目: | 本文受国家重点基础研究发展规划项目(2014CB340402),国家自然科学基金(61303054)资助 |
| |
摘 要: | 针对大数据离线分析类和交互式查询类负载,首先对这些负载的一些共性进行分析,提取出公共操作集,并对它们进行分组整理;然后在大数据平台上测试这些负载运行过程中的微体系结构特征,采用PCA和SimpleKMeans算法对这些体系结构特征参数进行降维和聚类处理。实验分析结果表明负载之间有公共的操作集,如Join和Cross Production;有些负载有相似的属性,如Difference和Projection共享相同的微体系结构特征。实验结果对于 处理器等硬件平台的设计以及应用程序的优化具有指导性的意义,并且为大数据基准测试平台的设计提供了参考。
|
关 键 词: | 大数据 大数据负载 体系结构特征 |
收稿时间: | 2014-10-17 |
修稿时间: | 2014-12-01 |
本文献已被 万方数据 等数据库收录! |
|