首页 | 本学科首页   官方微博 | 高级检索  
     

基于声学指纹的海量MP3文件近似去重方法
引用本文:赵晓永,杨扬,王宁.基于声学指纹的海量MP3文件近似去重方法[J].计算机工程,2013,39(7).
作者姓名:赵晓永  杨扬  王宁
作者单位:北京科技大学计算机与通信工程学院,北京,100083
基金项目:国家自然科学基金资助项目
摘    要:在互联网中重复上传他人已经分享的歌曲会消耗网络带宽,浪费存储空间,但目前的重复数据删除方法主要基于文件的二进制特征,无法识别经过信号处理或压缩后的歌曲.针对该问题,提出一种基于声学指纹的海量MP3文件近似去重方法.结合文件消息摘要的确定性与声学指纹的鲁棒性,在采用布隆过滤器对文件消息摘要一次去重的基础上,根据降维后的声学指纹值进行二次近似去重,保证高效的同时提高去重率.实验结果表明,与可变分块检测方法相比,该方法的去重率可提高1倍以上,扩展性较好.

关 键 词:声学指纹  重复数据删除  近似去重  布隆过滤器  海量数据

Near De-duplication Method of Massive MP3 Files Based on Acoustic Fingerprint
ZHAO Xiao-yong , YANG Yang , WANG Ning.Near De-duplication Method of Massive MP3 Files Based on Acoustic Fingerprint[J].Computer Engineering,2013,39(7).
Authors:ZHAO Xiao-yong  YANG Yang  WANG Ning
Abstract:
Keywords:acoustic fingerprint  data de-duplication  near de-duplication  Bloom Filter(BF)  massive data
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号