首页 | 本学科首页   官方微博 | 高级检索  
     

重复数据删除技术
引用本文:敖 莉,舒继武,李明强.重复数据删除技术[J].软件学报,2010,21(5):916-929.
作者姓名:敖 莉  舒继武  李明强
作者单位:1. 清华大学,计算机科学与技术系,北京,100084
2. 清华大学,计算机科学与技术系,北京,100084;清华大学,信息科学与技术国家实验室,筹,北京,100084
基金项目:国家自然科学基金,国家高技术研究发展计划(863计划),高等学校博士学科点专项科研基金 
摘    要:重复数据删除技术主要分为两类:相同数据的检测技术和相似数据的检测与编码技术,系统地总结了这两类技术,并分析了其优缺点.此外,由于重复数据删除技术会影响存储系统的可靠性和性能,又总结了针对这两方面的问题提出的各种技术.通过对重复数据删除技术当前研究现状的分析,得出如下结论:a) 重复数据删除中的数据特性挖掘问题还未得到完全解决,如何利用数据特征信息有效地消除重复数据还需要更深入的研究;b) 从存储系统设计的角度,如何引入恰当的机制打破重复数据删除技术的可靠性局限并减少重复数据删除技术带来的额外系统开销也是一个需要深入研究的方面.

关 键 词:网络存储系统  重复数据  数据删除  可靠性  性能
收稿时间:6/4/2008 12:00:00 AM
修稿时间:2009/10/9 0:00:00

Data Deduplication Techniques
AO Li,SHU Ji-Wu and LI Ming-Qiang.Data Deduplication Techniques[J].Journal of Software,2010,21(5):916-929.
Authors:AO Li  SHU Ji-Wu and LI Ming-Qiang
Affiliation:AO Li1,SHU Ji-Wu1,2+,LI Ming-Qiang11(Department of Computer Science , Technology,Tsinghua University,Beijing 100084,China) 2(National Laboratory for Information Science , Technology (TNList),China)
Abstract:Data deduplication technologies can be divided into two categories: a) identical data detection techniques, and b) similar data detection and encoding techniques. This paper presents a systematic survey on these two categories of data deduplication technologies and analyzes their advantages and disadvantages. Besides, since data deduplication technologies can affect the reliability and performance of storage systems, this paper also surveys various kinds of technologies proposed to cope with these two aspec...
Keywords:network storage system  duplicate data  data elimination  reliability  performance  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号