首页 | 本学科首页   官方微博 | 高级检索  
     

文档重复识别和解决一档多归问题方法探究
作者姓名:韩玉林  金云智  曾小明  王继鹏
作者单位:中海石油(中国)有限公司海南分公司
摘    要:<正>电子文档归档是一项非常严谨的工作,在归档过程中识别重复文档往往会耗费较大的人力。本文从实际问题出发,选取大量具有普遍代表性的文档,验证了MD5码可用于文档归档过程中识别重复文档的手段。该方法的实现可节约巨大的人力成本,同时可避免人工识别产生的误差。随着油气田勘探、开发工作量的日渐增加,相关的数据、档案、文档资料正以类似指数的形式迅猛增长。

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号