首页 | 本学科首页   官方微博 | 高级检索  
     

一个实用的针对URL的哈希函数
引用本文:肖明忠,闵博楠,王佳聪,代亚非.一个实用的针对URL的哈希函数[J].小型微型计算机系统,2006,27(3):538-541.
作者姓名:肖明忠  闵博楠  王佳聪  代亚非
作者单位:北京大学,计算机系,网络实验室,北京,100871
基金项目:科技部科研项目;面向21世纪教育振兴行动计划(985计划)
摘    要:在Web信息处理的研究中,不少情况下需要对很大的URL序列进行散列(hashing)操作.本文提出了一个针对URL数据集合的均匀哈希函数,它是ELFhash函数的变型.通过对天网搜索引擎采集的1亿多个URL集合的抽样实验表明:它能有效使得URL集在哈希表中均匀散布.并通过与MD5和SHA-1的对比,认为它是实用的.最后,指出了进一步的研究方向.

关 键 词:哈希函数  均匀分布
文章编号:1000-1220(2006)03-0538-04
收稿时间:11 8 2004 12:00AM
修稿时间:2004-11-08

Practical Hashing Function for URLs Set
XIAO Ming-zhong,MIN Bo-nan,WANG Jia-chong,DAI Ya-fei.Practical Hashing Function for URLs Set[J].Mini-micro Systems,2006,27(3):538-541.
Authors:XIAO Ming-zhong  MIN Bo-nan  WANG Jia-chong  DAI Ya-fei
Abstract:URL hashing is found many applications in Web research. We propose a hashing function for large scale URLs set and find it has better uniformity and stability than the other two (HfIp and hf) through three experiments of the large scale. It is a variation of the well-known function (ELFhash) and is recommended used in the applications of needing to hash URLs. Moreover, it has low time cost and almost performance compared with MD5 and SHA-1 so that we think it is more practical than the other. Finally, some future works are given.
Keywords:URL  ELFhash  MD5  SHA-1
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号