共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
3.
4.
脏数据是整个数据仓库的隐患,因此数据清理对维护数据仓库和大型数据库极有价值。本课题介绍和研究数据清理的方法和技术.重点讨论消除中文重复数据的分析方法.并且对这些方法进行验证.分析和实现。 相似文献
5.
针对传统远程备份中大量冗余数据导致备份效率低下和存储空间浪费的问题,设计并实现了一个基于重复数据删除的远程备份系统。首先根据文件的内容用Rabin指纹将备份文件划分为变长的数据块,把每个数据块的相关信息发送到备份中心,在备份中心利用Google Bigtable及Leveldb的索引算法辅以布隆过滤器对数据块进行判重,最后只传输和存储不重复的数据块。实验结果表明,采用该系统备份相似的数据集能够有效删除其中的重复数据。对数据集进行增量备份,在增量数据变化不大时,相比Rsync备份有更少的网络流量。 相似文献
6.
重复数据删除技术有效地提升了备份系统的备份效率,但重复数据的匹配开销也随之增加.针对该问题,设计并实现了一种基于重复数据删除的备份系统THBS,该系统提出了高精简的数据备份方法HAD(hierachical approach of data deduplication),依次从目录、文件、块、字节粒度分层多步,由粗及细地匹配删除重复数据,同时采用bloomfilter和倒排索引技术,以减少不必要的数据匹配与磁盘访问,提高匹配查找速度.通过两组真实数据集的实验发现,THBS在备份过程中节省了63.1%~96.7%的存储空间,比Scp和Rsync分别节约了71.3%~97.6%,41.2%~66.7%的网络带宽,累计备份时间分别为Scp和Rsync的75%~86%和91%~97%. 相似文献
7.
针对在文件备份服务器中存在大量重复数据的问题,设计了一种基于重复数据删除的文件备份系统,为位于不同地理位置的多个用户提供备份服务。该系统不仅删除用户内部的重复数据,也删除不同用户之间的重复数据,进一步节省存储空间,与此同时,采用了一定的安全机制来防止数据丢失以及用户数据信息泄漏。实验结果表明了系统的可行性,为多用户构建统一的备份中心提供了一种新的解决方案。 相似文献
8.
9.
李向前 《数字社区&智能家居》2013,(1):5-7,14
针对在数据备份服务器中存在大量重复数据的问题,提出了一种基于重复数据删除技术的oracle数据库备份系统。系统首先生成临时备份文件,然后把临时文件划分成不重叠的块,通过哈希算法计算每个块的指纹值。在数据灾备中心建立hash表记录已存储数据块的指纹值。通过对比指纹值,检测重复数据。为了提高数据安全性,采用了一定的安全机制来防止信息泄露以及数据丢失。实验证明,该系统在实现远程备份的同时,有效地减少了备份的数据。 相似文献
10.
11.
针对现有文件数据同步传输方法效率低、局部更新困难的问题,提出一种哈希链构建及文件数据同步方法。将C/S架构中服务器端文件或目录的变化作为一系列哈希节点,根据时间先后顺序,通过哈希函数迭代文件或目录的哈希值,形成能够记录文件库所有操作状态的有序哈希链。客户端只需根据哈希链节点执行相同文件操作并进行同步更新,而不需要对每个文件数据进行同步认证,确保文件库的完整性、不可抵赖性、可溯源性和防篡改性。采用有序哈希链的同步方法对不同终端进行文件数据差异监视和一致性检测,以快速获取文件变化并进行逻辑同步。实验结果表明,该方法在文件库未变动模式下的平均同步加速比为94.85%,在文件库变动的模式下,相较于“quick check”策略和常规策略的Rsync算法,平均同步加速比分别为6.5%和69.99%。有效地减少了同步过程中时间和资源的消耗。 相似文献
12.
13.
工业自动化控制中数据查重系统的设计与实现 总被引:1,自引:0,他引:1
本文系统地讨论了烟草工业自动化系统中用户管理数据库系统内经常出现的数据重复问题,并建立了几种数据重复判断模型,最后评定了几种模型的优缺点。 相似文献
14.
15.
16.
随着对系统工作可靠性的要求越来越高,双机在线热备在多个工程项目中广泛采用,继而对双机数据同步和在线数据备份也提出了相关需求,根据工程中的实际需求,针对双机数据同步和数据在线备份的解决方法做了深入的研究。通过对Oracle数据库的深入学习,利用Oracle数据库的数据能够根据约束条件实现分区存储的特点,提出了一种双机数据同步,数据库存储数据在线备份的解决方案,为相关人员提供了极有价值的参考信息和有效方法。 相似文献
17.
电子数据备份方法探讨 总被引:1,自引:0,他引:1
在广泛开展的信息化工作中,由于各种原因引起的电子数据丢失时常发生,当丢失的数据无法恢复时会造成不同程度的损失,因此需要对电子数据进行安全备份。针对电子数据备份的重要性及经常发生的问题,论述了数据备份的方式和等级,提出了加强数据备份的管理,健全管理制度以及完善数据备份的过程与环节。应用相关技术,在确保安全的前提下,选择操作性强、成本较低的备份方式和等级,充分发挥数据备份的作用。 相似文献
18.
在分析了基本数字签名方法的基础上,本文设计并实现了基于离散对数困难问题(DLP)、辅以Hash函数和公钥证书进行签名和验证签名的数字签名方法。它在随机Oracle模式下是安全的且签名方进行签名只需要一次指数运算、一次模乘运算和一次加法运算,在线计算量则只需一次乘法和一次加法,因而是高效的且适合智能卡的应用。 相似文献