基于Hadoop的优化海量录音小文件存取性能的方法 |
| |
引用本文: | 徐欢欢,朱信忠,赵建民,徐慧英.基于Hadoop的优化海量录音小文件存取性能的方法[J].微型电脑应用,2015(2):1-3. |
| |
作者姓名: | 徐欢欢 朱信忠 赵建民 徐慧英 |
| |
作者单位: | 浙江师范大学,数理与信息工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(61272468) |
| |
摘 要: | Hadoop作为一个分布式计算框架,在处理大容量数据方面有着显著优势。然而,因其Name Node节点问题的内存有瓶颈等问题,对于处理海量小文件的存取不利。提出了一种针对海量录音小文件的优化方法,充分利用录音文件相关性的特点,通过预处理模块归类文件,把录音小文件合并成一系列的sequencefile,并建立全局索引,最后,采用缓存机制及缓存优化策略进行进一步优化。实验证明,该方法能有效提高大批量小文件的存取性能。
|
关 键 词: | Hadoop 小文件 优化 存储性能 |
本文献已被 CNKI 等数据库收录! |
|