首页 | 本学科首页   官方微博 | 高级检索  
     

云存储环境下基于HDFS的海量小文件装箱算法
引用本文:王伟,徐文倩,赵少锋.云存储环境下基于HDFS的海量小文件装箱算法[J].通讯世界,2016(14).
作者姓名:王伟  徐文倩  赵少锋
作者单位:1. 河南工业贸易职业学院信息工程系,河南 郑州,451191;2. 中国建设银行总行,北京,100033;3. 河南财经政法大学云计算与大数据研究所,河南 郑州,450046
基金项目:河南省科技攻关项目(162102210096,152102210088,142102210090),河南省高等学校重点科研项目(15A5200
摘    要:基于HDFS的云存储系统在当前得到了广泛的应用,然而它存在小文件存储效率不理想的问题。针对该问题,提出了一种基于HDFS的海量小文件装箱算法TPSF。该算法综合考虑上传文件的大小和缓存时间两个指标,设计了基于动态权值的装箱策略。原型实现和性能评价表明,TPSF算法是可行和有效的,能够显著降低HDFS名称节点和数据节点的存储开销。

关 键 词:HDFS  小文件处理  装箱算法
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号