首页 | 本学科首页   官方微博 | 高级检索  
     

基于SHA-1的邮件去重算法
引用本文:张曼,李弼程,林琛.基于SHA-1的邮件去重算法[J].计算机工程,2008,34(11):270-272.
作者姓名:张曼  李弼程  林琛
作者单位:解放军信息工程大学信息工程学院,郑州,450002
摘    要:在邮件服务端和邮件客户端,重复邮件浪费了大量资源。该文提出一种基于SHA-1的邮件去重算法,将邮件按大小分开处理,根据Hash值快速去除正文相同或相似的重复邮件。实验结果表明了该算法的有效性,其运行速度比传统方法快。

关 键 词:重复邮件  相似度  去重算法
文章编号:1000-3428(2008)11-0270-03
修稿时间:2007年8月12日

Email Remove-duplicate Algorithm Based on SHA-1
ZHANG Man,LI Bi-cheng,LIN Chen.Email Remove-duplicate Algorithm Based on SHA-1[J].Computer Engineering,2008,34(11):270-272.
Authors:ZHANG Man  LI Bi-cheng  LIN Chen
Affiliation:(Information Engineering Institute, PLA Information Engineering University, Zhengzhou 450002)
Abstract:The duplicate-emails in service terminal and client terminal wastes a lot of recouse. This paper presents an email remove-duplicated algorithm based on Secure Hash Algorithm 1(SHA-1). Based on the size of email, this algorithm detects similarity of emails by comparing sets of Hash value of all paragraphs or all sentences in emails. The experimental results show that this algorithm has a good performance in computing time.
Keywords:duplicated-email  similarity  remove-duplicate algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号